Hier is de Ritual Research Digest van deze week, een nieuwsbrief die de laatste ontwikkelingen in de wereld van LLM's en de kruising van Crypto x AI behandelt. Met honderden gepubliceerde artikelen per week is het onmogelijk om bij te blijven met het laatste nieuws. Wij doen het lezen zodat jij dat niet hoeft te doen.
DeepSeekMath-V2: Naar Zelf-Controleerbare Wiskundige Redenering Dit paper introduceert DSMath-V2, een model getraind op deepseek-3.2-exp voor natuurlijk taalbewijzen in de wiskunde. De generatie-verificatie kloof is een grote hindernis voor informele bewijzen.
Ze trainen eerst een verifier voor het model met behulp van expertannotaties om zowel de juistheid van de antwoorden als de analyse te beoordelen. Deze verifier wordt gebruikt om het uiteindelijke bewijsmodel te trainen, dat zowel bewijzen schrijft als hun juistheid analyseert. Ze behalen goud op IMO 2025.
Artificial Hivemind: De Open-Eindige Homogeniteit van Taalmodellen (en Verder) Het paper introduceert INFINITY-CHAT, een dataset van 26K echte wereldvragen die meerdere antwoorden accepteren. Hiermee bestuderen ze intra- & inter-model mode collapse in 70+ LMs.
Ze onthullen een effect van een Kunstmatige Hivemind met intra-model herhaling, waarbij een model herhaaldelijk vergelijkbare uitkomsten genereert, en inter-model homogeniteit, waarbij verschillende modellen op vergelijkbare ideeën convergeren met kleine wijziging in formulering. Dit roept vragen op over modeldiversiteit.
Latente samenwerking in multi-agent systemen Het werk introduceert Latent MAS, een end-to-end samenwerkingsframework dat opereert in een continue latente ruimte. Het ontwerp integreert zowel latente gedachtegeneratie als cross-agent latente geheugenoverdracht.
LatentMAS is gebaseerd op redeneervaardigheid, communicatiefideliteit en samenwerkingscomplexiteit. In zowel sequentiële als hiërarchische MAS-instellingen presteert Qwen 3 (4B, 8B en 14B) beter dan tekstgebaseerde MAS-baselines, waardoor de nauwkeurigheid verbetert en het gebruik van uitvoertokens wordt verminderd.
ToolOrchestra: Intelligentie verhogen via efficiënte modellering en toolorchestratie De auteurs stellen een orchestratieparadigma voor waarbij intelligentie voortkomt uit een samengesteld systeem. Een orchestratiemodel roept de juiste tools in de juiste volgorde aan voor een taak.
Met ToolOrchestra wordt een 8B-model getraind met RL om te beslissen wanneer en hoe andere LMs en tools in te schakelen. De beloningen balanceren correctheid, efficiëntie en afstemming op gebruikersvoorkeuren. Op HLE presteert Orchestrator beter dan eerdere methoden met een veel lagere rekenkundige kost.
Volg ons @ritualdigest voor meer over alles wat met crypto x AI-onderzoek te maken heeft, en @ritualnet om meer te leren over wat Ritual aan het bouwen is.
3,34K