GLM-5技術報告書を発表します! GLM-5の打ち上げ後、私たちはその製造過程を明かしていきます。主な革新は以下の通りです: - DSA採用:長時間の文脈の忠実さを維持しつつ、トレーニングおよび推論コストを大幅に削減 - 非同期強化学習インフラストラクチャ:生成とトレーニングを分離することで、トレーニング後の効率を大幅に向上させる - エージェントRLアルゴリズム:複雑で長期的な相互作用からより効果的に学習できるようにします これらの革新により、GLM-5はオープンソースモデルの中でSOTA性能を達成し、特に実際のソフトウェアエンジニアリング課題で高い成果を上げています。