Aqui está o Ritual Research Digest desta semana, um boletim informativo que cobre as últimas novidades no mundo dos LLMs e a interseção de Crypto x AI. Com centenas de artigos publicados semanalmente, é impossível manter-se atualizado com as últimas novidades. Nós fazemos a leitura para que você não precise.
DeepSeekMath-V2: Rumo ao Raciocínio Matemático Auto-Verificável Este artigo apresenta o DSMath-V2, um modelo treinado com deepseek-3.2-exp para demonstração de linguagem natural em matemática. A lacuna de verificação geracional é um grande obstáculo para a prova informal.
Eles primeiro treinam um verificador para o modelo usando anotações de especialistas para avaliar tanto a correção das respostas quanto a análise. Esse verificador é usado para treinar o modelo final do provador, que tanto escreve provas quanto analisa sua correção. Eles conquistaram ouro na IMO 2025.
Mente Colmeia Artificial: A Homogeneidade Aberta dos Modelos de Linguagem (e Além) O artigo apresenta o INFINITY-CHAT, um conjunto de dados de 26 mil consultas do mundo real que aceitam múltiplas respostas. Usando isso, eles estudam o colapso dos modos intra e inter-modelo em 70+ LMs.
Eles descobrem um efeito de Mente Colmeia Artificial com repetição intra-modelo, onde um modelo gera repetidamente resultados semelhantes, e homogeneidade entre modelos, onde diferentes modelos convergem para ideias semelhantes com pequenas mudanças de fraseado. Isso levanta questões sobre diversidade de modelos.
Colaboração Latente em Sistemas Multiagente O trabalho introduz o Latent MAS, uma estrutura colaborativa de ponta a ponta que opera em um espaço latente contínuo. O projeto integra tanto geração de pensamento latente quanto transferência de memória latente entre agentes.
O LatentMAS é baseado na expressividade do raciocínio, fidelidade da comunicação e complexidade da colaboração. Tanto em configurações sequenciais quanto hierárquicas de MAS, o Qwen 3(4B, 8B e 14B), o LatentMAS supera as linhas de base baseadas em MAS baseadas em texto, melhorando a precisão e reduzindo o uso de tokens de saída.
ToolOrchestra: Elevando a Inteligência por Meio de Orquestração Eficiente de Modelos e Ferramentas Os autores propõem um paradigma de orquestração onde a inteligência emerge de um sistema composto. Um modelo de orquestrador invoca as ferramentas corretas na ordem correta para uma tarefa.
Usando o ToolOrchestra, um modelo 8B é treinado com RL para decidir quando e como invocar outros LMs e ferramentas. As recompensas equilibram correção, eficiência e alinhamento com as preferências do usuário. No HLE, o Orchestrator supera métodos anteriores com custo computacional muito menor.
Siga-nos @ritualdigest para saber mais sobre todas as pesquisas sobre criptomoedas x IA e @ritualnet para saber mais sobre o que a Ritual está construindo.
3,35K