Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Я хотів би зробити кілька уточнень, які, на нашу думку, були чітко визначені у нашій статті, але не були в моєму початковому дописі (повторний аналіз @METR_Evals даних).
Наш внесок полягає в тому, щоб представити прогрес як множний продукт сигмоїдів навколо різних інновацій. Враховуючи дані METR, ми розділили їх на покращення базових можливостей (розмір даних/моделі) та міркування.
Ми показуємо, що цей продукт забезпечує подібне *в-вибіркове* підходження до малих наборів даних, які ми спостерігаємо як експоненціальний ріст. Однак наслідки дуже різні! За нашою моделлю нам потрібні були б постійні інновації (подібні до логіки), щоб бачити експоненційний прогрес.
Це не означає, що ми виключаємо експоненціальний прогрес або що наш продукт сигмоїдів є правильною моделлю. Це просто означає, що існує мало точок і кілька можливих базових моделей із дуже різними наслідками.
Наш продукт Sigmoid Fit насправді дуже добре підходить, якщо тримати GPT 5.2 та/або Gemini 3 pro. Ми виглядаємо гірше, якщо додатково тримати Claude Opus 4.5, але все одно це можливо. Наша мета — не сперечатися щодо показників OOS на основі кількох точок даних, а вказувати на те, що існуючі прогнози є крихкими і не моделюють послідовність різних інновацій. (Є ще кілька підходів у X, але вони, здається, не використовують наш запропонований продукт sigmoid (Sigmoids), тому я не можу сказати, що там відбувається...)
Вибачте за мій попередній допис без нюансів — ми сподіваємося, що люди прочитають цю статтю!
Найкращі
Рейтинг
Вибране
