Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Inception Labs a lansat Mercury 2, următoarea lor generație de Diffusion LLM, gata de producție. Mercury 2 atinge >1.000 de tokenuri de ieșire/s cu creșteri semnificative în inteligență
LLM-urile Diffusion ("dLLM-uri") ale @_inception_ai folosesc o arhitectură diferită comparativ cu LLM-urile bazate pe autoregresivă. Procesul de generare a LLM-urilor prin difuzie începe cu zgomot și rafinează iterativ ieșirea folosind un model de transformator care poate modifica mai multe jetoane în paralel. Aceasta permite paralelizarea generării tokenurilor de ieșire, permițând viteze de ieșire mai rapide deoarece multe tokenuri de ieșire sunt generate simultan.
Concluzii cheie:
➤ Dintre modelele de dimensiuni/preț comparabile, Mercury 2 performează competitiv la inteligență vs. viteză de ieșire. Deși nu are inteligență de top, viteza sa de ieșire este de peste 3 ori mai rapidă decât următorul model din această clasă (benchmark-uri bazate pe endpoint-urile first-party sau mediana furnizorilor care servesc modelul acolo unde un endpoint first party nu este disponibil)
➤ Punctele forte cheie includ codificarea agentică și utilizarea terminalului și urmărirea instrucțiunilor. Mercury 2 performează la un nivel similar cu Claude 4.5 Haiku pe Terminal-Bench Hard și obține 70% la IFBench (Instruction Following), depășind gpt-oss-120B, GPT-5.1 Codex mini și GPT-5 nano
Contextul Inception Labs:
Aceasta este a doua versiune a Inception Labs. Fondatorii au fost anterior profesori de la Stanford, UCLA și Cornell și au contribuit la cercetare și tehnologii AI precum Flash Attention, Decision Transformers și Direct Preference Optimization (DPO).
Vezi mai jos pentru analize suplimentare.

Compararea vitezei de ieșire cu alte modele (benchmark-uri bazate pe endpoint-urile first-party sau mediana furnizorilor care servesc modelul acolo unde un endpoint first party nu este disponibil)


Mercury 2 performează peste așteptări comparativ cu modelele mici comparabile la mai multe evaluări agentice, inclusiv GDPval-AA, Terminal-Bench Hard și τ²-Bench Telecom, oferind în același timp viteze ridicate de ieșire

Vezi Analiza Artificială pentru detalii suplimentare și repere ale lui Mercur 2:
11,35K
Limită superioară
Clasament
Favorite
