Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Voici le Digest de Recherche Rituel de cette semaine, une newsletter couvrant les dernières nouvelles dans le monde des LLM et l'intersection entre Crypto et AI.
Avec des centaines d'articles publiés chaque semaine, il est impossible de rester à jour avec les dernières informations. Nous faisons la lecture pour que vous n'ayez pas à le faire.

DeepSeekMath-V2 : Vers un raisonnement mathématique auto-vérifiable
Cet article présente DSMath-V2, un modèle entraîné sur deepseek-3.2-exp pour la preuve en langage naturel en mathématiques. L'écart génération-vérification est un obstacle majeur pour la preuve informelle.

Ils forment d'abord un vérificateur pour le modèle en utilisant des annotations d'experts pour évaluer à la fois la justesse des réponses et l'analyse.
Ce vérificateur est utilisé pour former le modèle de preuve final, qui rédige à la fois des preuves et analyse leur justesse.
Ils obtiennent l'or à l'IMO 2025.
Hivemind Artificiel : L'Homogénéité Ouverte des Modèles Linguistiques (et au-delà)
Le document présente INFINITY-CHAT, un ensemble de données de 26K requêtes du monde réel qui acceptent plusieurs réponses. En utilisant cela, ils étudient l'effondrement de mode intra- et inter-modèles dans plus de 70 LMs.

Ils découvrent un effet de Hivemind Artificiel avec répétition intra-modèle, où un modèle génère de manière répétée des sorties similaires, et homogénéité inter-modèle, où différents modèles convergent vers des idées similaires avec de légers changements de formulation. Cela soulève des questions sur la diversité des modèles.

Collaboration Latente dans les Systèmes Multi-Agents
Le travail présente Latent MAS, un cadre collaboratif de bout en bout qui fonctionne dans un espace latent continu. La conception intègre à la fois la génération de pensées latentes et le transfert de mémoire latente entre agents.

LatentMAS est basé sur l'expressivité du raisonnement, la fidélité de la communication et la complexité de la collaboration. Dans les contextes MAS séquentiels et hiérarchiques, Qwen 3 (4B, 8B et 14B), LatentMAS surpasse les références MAS basées sur le texte, améliorant la précision et réduisant l'utilisation des tokens de sortie.

ToolOrchestra : Élever l'intelligence grâce à une orchestration efficace des modèles et des outils
Les auteurs proposent un paradigme d'orchestration où l'intelligence émerge d'un système composite. Un modèle d'orchestrateur invoque les bons outils dans le bon ordre pour une tâche.

En utilisant ToolOrchestra, un modèle 8B est entraîné avec RL pour décider quand et comment invoquer d'autres LMs et outils. Les récompenses équilibrent la justesse, l'efficacité et l'alignement avec les préférences des utilisateurs.
Sur HLE, l'Orchestrateur surpasse les méthodes précédentes avec un coût computationnel bien inférieur.

Suivez-nous @ritualdigest pour en savoir plus sur tout ce qui concerne la crypto et la recherche en IA, et @ritualnet pour en apprendre davantage sur ce que Ritual est en train de construire.
3,35K
Meilleurs
Classement
Favoris
