Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Me pregunto si los hermanos de MiniMax aceptarán públicamente la derrota cuando avancen al #3. Ha sido molesto cómo se jactan del supuesto fracaso del escalado NSA y su genial decisión de optar por GQA (y ni siquiera GQA tan ingeniosa como en StepFun). Modelo rápido, caro y con poca atención.

No les reprocho la decisión técnica real, de todas formas pueden hacer como los demás y cambiar a DSA/híbrido MLA (o cualquier otra cosa). Su enfoque con M2 ha sido claramente los datos y el entrenamiento, y habían avanzado muchísimo en ese aspecto. Pero era molesto.

518

Populares

Ranking

Favoritas