Повторення вашого завдання може значно підвищити точність LLM. Google щойно показав незначну зміну, яка виграла 47 із 70 тестів. Жодних додаткових жетонів. Без додаткової затримки. Зафіксовано жодних втрат. Швидке повторення підвищує точність Метод простий. Відправте однаковий вхід двічі, один за одним. Мовні моделі читають токени у порядку. Ранні частини обробляються без повного контексту. На другому проході повна картина вже існує. Прогнози стають більш стабільними та точними. Він працює між основними моделями Стаття тестує популярні системи у масштабі. Кожна оцінена модель покращується без увімкненого міркування. Ключові результати: > 47 перемог із 70 бенчмарків > Регресії з нульовою точністю > Збільшення довжини виходу не було > Немає вимірюваних витрат на затримку Він дозволяє розгортання без дозволу Виходи зберігають той самий формат. Існуючі конвеєри залишаються незмінними. Ви отримуєте більшу точність, якщо скопіювати і вставити один раз.