2026 год консолидируется в 3 действительно большие ставки, где если одна потерпит неудачу, это приведет к краткосрочному коллапсу пузыря 1. центры обработки данных Anthropic, Xai активно наращивают мощности до 1M GPU. Оба планируют достичь этой цели к 2 кварталу. Результирующие модели, обученные на этой инфраструктуре, должны подтвердить, что закон масштабирования вычислений все еще эффективен. В противном случае это будет означать, что нам нужно исследовать новую архитектуру модели. Это также зависит от энергетической инфраструктуры (power shell), которая должна быть масштабирована, хотя это будет проблемой на следующее десятилетие, не говоря уже об этом году. 2. память У нас есть достаточно памяти в этом году, чтобы поддерживать 15GW мощностей GPU, в то время как гипермасштаберы нацелены на 30-40 в течение следующих 2 лет. Мы находимся на грани - если Samsung, $MU или SK Hynix провалят свое производство, это остановит первую ставку. Также тот, кто обеспечит большинство этой памяти для создания GPU, выиграет больше всего в условиях ограниченной производственной мощности, и сейчас это $NVDA. 3. более дешевая и эффективная инфраструктура Последний GPU от Nvidia Vera Rubin в 5 раз более производителен, но что более важно, в 4 раза более эффективен с точки зрения вычислений, что означает, что затраты на вывод упали - передовая интеллектуальная система за копейки! В этом году будет изобилие вычислительных мощностей, доступных для обучения, но что более важно, для использования ИИ, поэтому парадокс Джевонса должен подтвердить себя через растущий спрос. Если это не сработает, то вышеуказанные два пункта рухнут. На мой взгляд, я меньше всего беспокоюсь об этом - я думаю, что агентские системы и обучение с подкреплением после обучения продолжат укреплять модели. Очень оптимистично