Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Dr_Gingerballs
Инженер. Исследователь. Наслаждающийся Стомком. Дерьмовый постер. Я собираю данные о вариантах и выкладываю их на X.
Привет всем, кто говорит, что вычисления на базе ИИ становятся дешевле. OpenAI зарабатывает около 1,20 доллара за кВтч вычислений каждый год на протяжении последних 3 лет. Никакого снижения затрат за 3 года.
Удобно, что для работы H100 требуется около 1 кВт, так что они зарабатывают 1,20 доллара за час работы GPU. Резервированные экземпляры стоят от 2 до 7 долларов в час за GPU (также работают с убытком почти все). Так что в ЛУЧШЕМ случае OpenAI ожидает убыток в 20 миллиардов долларов в этом году, и это может быть в несколько раз больше.
Маловероятно, что у них есть более 30 миллиардов долларов после недавнего вливания в 22 миллиарда долларов от Softbank. У них осталось менее года, и они исчерпывают "глупые" деньги, чтобы продвигаться дальше без IPO. Иск от Musk усложняет этот график, если это вообще возможно.
Поэтому они переходят к рекламе, потому что без нее они умрут в этом году.
Спасибо за ваше внимание к этому вопросу.

Chris19 янв., 02:22
🚨 Финансовый директор OpenAI Сара Фрайер только что опубликовала огромное обновление по доходам: более $20B ARR.
В статье также говорилось:
"Вычислительные мощности выросли примерно в 3 раза по сравнению с прошлым годом (0,2 ГВт в 2023 году, 0,6 ГВт в 2024 году, примерно 1,9 ГВт в 2025 году). Доходы следовали той же кривой: $2B ARR в 2023 году, $6B в 2024 году и более $20B в 2025 году."
Если ARR растет так быстро в таких объемах, можно ли с уверенностью сказать: "ай-бабл был обманом"?

30
Я испытал это 15 лет назад в аспирантуре, когда мог удаленно выполнять задачи на лабораторных компьютерах и высокопроизводительных кластерах. В итоге я запустил много вещей, которые не имели ценности, потому что считал, что 24x7 параллелизм более ценен, чем правильная симуляция один раз.

Ryan Carson18 янв., 10:01
Я начинаю испытывать сильный FOMO, если мои агенты не работают 24/7.
Кажется, что упущенная выгода колоссальна.
Это как если бы у вас была команда из 100 инженеров, которые просто сидят без дела, потому что вы не дали им работы.
На самом деле, это не очень приятное чувство.
И я чувствую это даже после того, как выпустил функцию в субботу.
Кто-то еще испытывает это?
33
Как такие вещи попадают в природу и науку? Это сбивает с толку. Конечно, если вы зададите регрессии правильные правила с самого начала, она будет экстраполировать лучше позже. Это кажется тривиальным, очевидным и не является интеллектом. Интеллект — это модель, которая приходит к F=ma.

Jorge Bravo Abad16 янв., 20:05
Физически обоснованная GNN, которая изучает законы Ньютона на основе данных и экстраполирует на системы в 35 раз больше
Большинство нейронных сетей для физического моделирования требуют много данных и хрупки. Обучите их на одной конфигурации, и они разваливаются, когда вы меняете граничные условия, увеличиваете систему или проводите длительные запуски. Основная проблема: эти модели изучают корреляции, а не законы сохранения.
Винай Шарма и Ольга Финк используют другой подход с Dynami-CAL GraphNet. Вместо того чтобы надеяться, что сеть откроет физику, они встраивают её непосредственно в архитектуру. Ключевое понимание: третий закон Ньютона гарантирует, что внутренние силы сохраняют линейный и угловой момент — даже когда энергия рассеивается через трение или неупругие столкновения.
Они достигают этого с помощью новой локальной системы отсчета, которая является SO(3)-эквивариантной, инвариантной к трансляциям и антисимметричной при обмене узлов. Силы, декодированные из встраиваний рёбер, автоматически равны и противоположны. Угловой момент получает такое же обращение: сеть предсказывает как внутренние моменты, так и точку приложения силы, изолируя вращение от орбитальных вкладов.
Результаты впечатляют. Обученная всего на пяти траекториях 60 сталкивающихся сфер в стационарной коробке, модель экстраполирует на вращающийся цилиндрический бункер с 2,073 частицами — поддерживая стабильные, физически согласованные запуски на протяжении 16,000 временных шагов. На ограниченных N-телесных системах, захвате движений человека и динамике молекул белка она превосходит специализированные базовые модели, требуя при этом меньше данных.
Сообщение: когда вы встраиваете законы сохранения в архитектуру, а не в функцию потерь, вы получаете модели, которые обобщаются на разных масштабах, геометриях и граничных условиях — потому что они с самого начала усвоили правильный индуктивный уклон.
Статья:

31
Топ
Рейтинг
Избранное