より少ない資源でより多くのことを成し遂げる — 主要なオープンソースモデルのベンチマーク。 「アクティブパラメータ数のごく一部で動作しているにもかかわらず、ZAYA1ベース(760mアクティブ)は、Qwen3-4B(Alibaba)やGemma3-12B(Google)などの主要モデルと同等の性能を達成し、推論、数学、コーディングベンチマークの面でLlama-3-8B(Meta)やOLMoEなどのモデルを上回る性能を発揮しています。」 最初のチャート — Zyphraの圧縮畳み込み注意(CCA)の詳細: 追伸:私のキャッチフレーズへの返答:「Zyphraは皮肉なく*send*西洋のDeepSeek...特に、DeepSeekが最もオープンで人口統計的にも西洋的な研究所の一つだからです(一方、DeepSeekはもちろん100%中国人です)。数学的厳密さと科学的文化。」 — + 技術ブログ:および + 技術論文: + ハグフェイス: