Вот дайджест Ritual Research за эту неделю, информационный бюллетень, охватывающий последние события в мире LLM и пересечении Crypto x AI. С сотнями статей, публикуемых еженедельно, оставаться в курсе последних новостей невозможно. Мы читаем, чтобы вам не пришлось.
DeepSeekMath-V2: К самопроверяемому математическому рассуждению В этой статье представлена DSMath-V2, модель, обученная на deepseek-3.2-exp для доказательства на естественном языке в математике. Разрыв между генерацией и верификацией является основной преградой для неформального доказательства.
Сначала они обучают проверяющего для модели, используя аннотации экспертов, чтобы оценить как правильность ответов, так и анализ. Этот проверяющий используется для обучения финальной модели доказателя, которая как пишет доказательства, так и анализирует их правильность. Они достигают золота на IMO 2025.
Искусственный Ум: Открытая Гомогенность Языковых Моделей (и не только) В статье представлено INFINITY-CHAT, набор данных из 26K реальных запросов, которые принимают несколько ответов. С его помощью они изучают коллапс режимов внутри и между моделями в более чем 70 языковых моделях.
Они обнаруживают эффект Искусственного Ума с внутримодельной повторяемостью, когда модель многократно генерирует похожие результаты, и межмодельной однородностью, когда разные модели сходятся на схожих идеях с незначительными изменениями формулировок. Это вызывает вопросы о разнообразии моделей.
Латентное сотрудничество в многопользовательских системах В работе представлена Латентная MAS, комплексная коллаборативная структура, работающая в непрерывном латентном пространстве. Дизайн интегрирует как генерацию латентных мыслей, так и передачу латентной памяти между агентами.
LatentMAS основан на выразительности рассуждений, надежности коммуникации и сложности сотрудничества. В условиях как последовательных, так и иерархических MAS, Qwen 3(4B, 8B и 14B) превосходит текстовые базовые линии MAS, улучшая точность и снижая использование токенов на выходе.
ToolOrchestra: Повышение интеллекта через эффективную оркестрацию моделей и инструментов Авторы предлагают парадигму оркестрации, где интеллект возникает из составной системы. Модель оркестратора вызывает правильные инструменты в правильном порядке для выполнения задачи.
С помощью ToolOrchestra модель 8B обучается с использованием RL, чтобы решать, когда и как вызывать другие LMs и инструменты. Награды балансируют правильность, эффективность и соответствие предпочтениям пользователя. На HLE Orchestrator превосходит предыдущие методы с гораздо меньшими вычислительными затратами.
Подписывайтесь на нас @ritualdigest, чтобы узнать больше о всем, что связано с криптовалютой и исследованиями в области ИИ, а также @ritualnet, чтобы узнать больше о том, что строит Ritual.
3,34K