Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Meituan LongCat
🚀 Scalarea încorporațiilor, nu doar experților—introducând o nouă cale pentru LLM-uri eficiente.
Constatare cheie: În scenarii cu raritate ridicată, încorporarea N-gramurilor oferă o frontieră Pareto mai bună decât simpla adăugare a mai multor experți MoE.
Prin urmare, introducem LongCat-Flash-Lite—primul model opensource construit pe această perspectivă.
⚙️ 68,5B Total Params(37,13B non-embedding) | 2.9B~4.5B Activ
📊 Performanță ridicată: SWE-Bench 54.4 | τ²-Bench 72.8 | TerminalBench 33.75
📃 Fereastră de context 256K (alimentată de YARN)
✨ Optimizat pentru Agentic/Coding, puternic în raționament general
⚡ ~700 token/s viteză maximă de inferență
Rezultatul: Obține performanță competitivă la scara sa, cu un cost și o latență semnificativ mai mici.
Față de îmbrățișare:
Raport tehnic:



21
🚀 Raport tehnic LongCat-Flash-Thinking-2601 – acum lansat complet!
Perspective cheie:
🌍 RL agentic la scară largă (14 pagini de analize aprofundate!)
🔹 Scalarea mediului: O privire detaliată asupra pipeline-ului nostru automatizat care construiește 10.000+ medii executabile, verificabile, pe 20+ domenii.
🔹 Infrastructură RL: Un cadru DORA îmbunătățit care suportă antrenament asincron cu 32.000+ medii concurente, abordând probleme de stabilitate în sarcini cu coadă lungă și foarte eterogene.
🛡️ Robustețe în sălbăticie
🔹 Injecție de zgomot: Fără agenți "de seră". Analizăm sistematic zgomotul din lumea reală (zgomot de utilizator/uneltă) și îl injectăm direct în bucla de antrenament.
🔹 Curriculum RL: O strategie bazată pe curriculum care întărește treptat modelul în medii dezordonate și imperfecte.
🧠 Cadrul de gândire grea
🔹 Raționament paralel: Extinde lățimea generând multiple traiectorii de raționament independente.
🔹 Rezumare iterativă: Extinde profunzimea folosind un model sumar pentru a reflecta și sintetiza traiectorii paralele înainte de a lua decizii finale.
🔹 Memorie contextuală: Un modul de memorie construit special pentru a menține raționamentul coerent pe termen lung.
⚡ Atenție în zigzag
🔹 Proiectarea conectivității Zigzag combinând MLA + SSA pentru a reduce calculele, păstrând în același timp fluxul global de informații.
🔹 Trecerea la variante rare în timpul antrenamentului oferă o accelerare de 1,5× și suportă contexte cu 1 milion de tokenuri — punând bazele unor progrese viitoare în raționamentul agentic pe termen lung.
🔹 Explorează:
📊 Obține SOTA printre
modele open-source în cadrul principalelor benchmark-uri agențice: căutare, utilizarea uneltelor, raționament matematic și programare.
Dacă doriți mai multe detalii, nu ezitați să consultați raportul tehnic complet.
• Hârtie:
• Site web:
• GitHub:
• Îmbrățișare a faței:




3
🚀 Vă prezentăm LongCat-Flash-Thinking-2601 — O versiune construită pentru gândirea agentică profundă și generală.
✨ Momente importante:
🤖 Capabilități de agent de top
🔹 Performanță: Rezultate de top la benchmark (TIR / Căutare Agentică / Utilizare Unelte Agentice); capacitate superbă de generalizare, depășindu-l pe Claude în sarcini complexe, aleatorii
🔹 Scalare ambientală: Mai multe medii construite automat și de înaltă calitate; Graf de dependență dens
🔹 Multi-Env RL: DORA extinsă (infrastructura noastră RL), susținând antrenament agentic multi-mediu la scară largă
🛡️ Robustețe în lumea reală
🔹 Performanță: Performanță solidă în situații dezordonate și incerte (Vita-Noise & Tau^2-Noise)
🔹 Analiza zgomotului: Analiză sistematică a zgomotului din lumea reală în scenarii agențice
🔹 Curriculum RL: Creșterea tipului și intensității zgomotului în timpul antrenamentului
🎯 Modul de gândire grea
🔹 Gândire paralelă: Extinde gama prin multiple trasee independente de raționament
🔹 Rezumare iterativă: Îmbunătățește profunzimea folosind un model de rezumat pentru a sintetiza ieșirile, susținând buclele de raționament iterativ
📅 Încă ceva: contextul cu 1M token prin Zigzag Attention va apărea în curând.
🔍 Încearcă acum:
✅ Este disponibil și acces API pentru această versiune.
Față de îmbrățișare:
GitHub:


3
Limită superioară
Clasament
Favorite
