DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Saya ingin tahu apakah MiniMax bros akan secara terbuka mengambil L ketika mereka maju ke #3. Sangat menjengkelkan bagaimana mereka menyombongkan diri tentang kegagalan penskalaan NSA dan keputusan jenius mereka untuk menggunakan GQA (dan bahkan GQA yang cerdas seperti di StepFun). Model cepat dan mahal dengan perhatian yang lemah.

Saya tidak memegang keputusan teknis yang sebenarnya terhadap mereka, bagaimanapun mereka dipersilakan untuk melakukan seperti yang lain dan beralih ke DSA/hybrid MLA (atau apa pun). Fokus mereka dengan M2 jelas adalah data dan pelatihan, dan mereka telah membuat banyak kemajuan di sana. Tapi itu menjengkelkan.

514

Teratas

Peringkat

Favorit