в этом году протестировано более 500 моделей, выпущен продукт AI с более чем 6 тыс. пользователей. наблюдения: 1. чат достигает потолка 2. войны моделей устаревают старые модели 3. открытый код лучше для создателей 4. оценки должны измерять выполнение задач 5. контекст важнее, чем улучшенное рассуждение