Трохи глибоких роздумів про бізнес-модель на передовій моделі. Усе це ґрунтується на цифрах, які зливають The Information, NYT тощо. 🔵Ядро: це машина для обчислювального запису У своїй основі модель надзвичайно проста: майже всі витрати походять від обчислювальних висновків і особливо навчання. Тренування підпорядковується чомусь схожим на закон масштабування. Припустимо, витрати зростають ~5 разів щороку; а рентабельність витрат на навчання — у 2 рази. Це створює дивну динаміку: Вартість навчання першого року: 1 Дохід за другий рік від цієї моделі: 2 Але вартість навчання на другий рік для наступної моделі: 5 Нетто: +2 - 5 = -3 Якщо запустити вперед, стає ще гірше: Дохід за 3 рік: +10 Вартість навчання на 3 рік: -25 Нетто: -15 Моделі Frontier, у нинішньому вигляді, є сніжками з негативним грошовим потоком. Кожне покоління витрачає більше грошей, ніж попереднє. Щоб це коли-небудь змінилося на позитивний грошовий потік, логічно можуть змінитися лише дві речі: Відповідь. Дохід зростає значно швидше, ніж у 2x, або B. Зростання вартості навчання сповільнюється з 5 разів на рік до приблизно <2 разів Генеральний директор Anthropic Даріо Амодей розбив сценарій B («витрати на навчання припиняють експоненціальне зростання») на дві можливі реальності: 1/ Фізичні/економічні обмеження: Ви просто не можете навчити модель у 5 разів більшу — недостатньо чипів, недостатньо потужності, або вартість наближається до світового ВВП....