Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Iată Ritual Research Digest din această săptămână, un buletin informativ care acoperă cele mai recente noutăți din lumea LLM-urilor și intersecția dintre Crypto x AI.
Cu sute de lucrări publicate săptămânal, este imposibil să rămânem la curent cu cele mai recente. Noi citim ca să nu trebuiască să o faceți.

DeepSeekMath-V2: Către raționament matematic auto-verificabil
Această lucrare prezintă DSMath-V2, un model antrenat pe deepseek-3.2-exp pentru demonstrarea limbajului natural în matematică. Diferența de verificare a generațiilor este un obstacol major pentru demonstrarea informală.

Mai întâi antrenează un verificator pentru model folosind adnotări de experți pentru a evalua atât corectitudinea răspunsurilor, cât și analiza.
Acest verificator este folosit pentru a antrena modelul final de demonstrare, care atât scrie demonstrații, cât și analizează corectitudinea acestora.
Au obținut aurul în IMO 2025.
Mintea colectivă artificială: Omogenitatea deschisă a modelelor lingvistice (și dincolo de ea)
Lucrarea introduce INFINITY-CHAT, un set de date de 26K interogări reale care acceptă răspunsuri multiple. Folosind aceasta, studiază colapsul modurilor intra- și inter-model în 70+ LM-uri.

Ei descoperă un efect de minte colectivă artificială cu repetiție intra-model, unde un model generează în mod repetat ieșiri similare, și omogenitate între modele, unde modele diferite converg asupra unor idei similare cu modificări minore de formulare. Acest lucru ridică întrebări despre diversitatea modelelor.

Colaborarea latentă în sistemele multi-agent
Lucrarea introduce Latent MAS, un cadru colaborativ end-to-end care funcționează într-un spațiu latent continuu. Designul integrează atât generarea gândurilor latente, cât și transferul memoriei latente cross-agent.

LatentMAS se bazează pe expresivitatea raționamentului, fidelitatea comunicării și complexitatea colaborării. Atât în setările MAS secvențiale, cât și în cele ierarhice, Qwen 3(4B, 8B și 14B), LatentMAS depășește liniile de bază MAS bazate pe text, îmbunătățind acuratețea și reducând utilizarea tokenurilor de ieșire.

ToolOrchestra: Ridicarea inteligenței prin orchestrarea eficientă a modelelor și instrumentelor
Autorii propun o paradigmă de orchestrare în care inteligența apare dintr-un sistem compozit. Un model orchestrator invocă uneltele corecte în ordinea corectă pentru o sarcină.

Folosind ToolOrchestra, un model 8B este antrenat cu RL pentru a decide când și cum să invoce alte LM-uri și unelte. Recompensele echilibrează corectitudinea, eficiența și alinierea cu preferințele utilizatorului.
Pe HLE, Orchestrator depășește metodele anterioare cu costuri computaționale mult mai mici.

Urmăriți-ne @ritualdigest pentru mai multe despre toate lucrurile legate de cercetarea crypto x AI și
@ritualnet să aflați mai multe despre ce construiește Ritual.
3,34K
Limită superioară
Clasament
Favorite
