Парадоксальные отношения в технологии, связанные с парадоксом Джевонса, но немного в стороне: Чипы ИИ доступны сегодня Но вы могли бы более эффективно развернуть более эффективные чипы через 3 года В чем спешка? Технология, находящаяся на фоне быстрого снижения затрат, почти обязательно делит рынок между теми, кто считает, что доступ к неэффективной технологии сегодня даст им гораздо лучшее положение в будущем, и теми, кто считает, что лучше работать с узлом или двумя позади. Затраты на генерацию токенов обрушиваются. И все же поставщики моделей ИИ платят дорого — как и их пользователи — за генерацию токенов сегодня, которые завтра будут выглядеть ужасно неэффективно. Либо агрессивные пользователи заблуждаются, либо временные затраты на негенерацию токенов должны превышать даже крутой кривой производительности, которую следует генерация токенов. На аппаратной основе — оставляя в стороне архитектурные улучшения — затраты на генерацию токенов примерно вдвое снижаются ежегодно. Это должно означать, что воспринимаемая доходность от генерации токенов составляет как минимум 100% в год. Гигаватт вычислений сегодня так же ценен, как 2 ГВт в следующем году. Это почти неизбежно приводит к космическим вычислениям. Чувствительное к различным входным данным, похоже, что космические вычисления ИИ становятся экономически эффективными по сравнению с наземными вычислениями ИИ на основе токенов примерно при $400 за кг в затратах на запуск. Хотя мы еще не достигли этого, Starship при разумных объемах — то, что мы ожидали от SpaceX к 2030 году до появления возможности космических вычислений — должно пересечь этот порог затрат. Однако более важно, чем стоимость, это время. Компании ИИ сейчас испытывают нехватку флопов. В масштабах отрасли мы ожидаем, что наземные дата-центры установят 90 ГВт в 2030 году, накопительно построив 250 ГВт между сейчас и тогда. Это возможно, но агрессивно, учитывая трудности в строительстве реальной инфраструктуры в реальных местах, населенных реальными людьми (которые могут броситься под бульдозер, потому что прочитали ту книгу, которая гиперболически преувеличивала использование воды дата-центрами в 1000 раз). ...