Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Я хотів би зробити кілька уточнень, які, на нашу думку, були чітко визначені у нашій статті, але не були в моєму початковому дописі (повторний аналіз @METR_Evals даних). Наш внесок полягає в тому, щоб представити прогрес як множний продукт сигмоїдів навколо різних інновацій. Враховуючи дані METR, ми розділили їх на покращення базових можливостей (розмір даних/моделі) та міркування. Ми показуємо, що цей продукт забезпечує подібне *в-вибіркове* підходження до малих наборів даних, які ми спостерігаємо як експоненціальний ріст. Однак наслідки дуже різні! За нашою моделлю нам потрібні були б постійні інновації (подібні до логіки), щоб бачити експоненційний прогрес. Це не означає, що ми виключаємо експоненціальний прогрес або що наш продукт сигмоїдів є правильною моделлю. Це просто означає, що існує мало точок і кілька можливих базових моделей із дуже різними наслідками. Наш продукт Sigmoid Fit насправді дуже добре підходить, якщо тримати GPT 5.2 та/або Gemini 3 pro. Ми виглядаємо гірше, якщо додатково тримати Claude Opus 4.5, але все одно це можливо. Наша мета — не сперечатися щодо показників OOS на основі кількох точок даних, а вказувати на те, що існуючі прогнози є крихкими і не моделюють послідовність різних інновацій. (Є ще кілька підходів у X, але вони, здається, не використовують наш запропонований продукт sigmoid (Sigmoids), тому я не можу сказати, що там відбувається...) Вибачте за мій попередній допис без нюансів — ми сподіваємося, що люди прочитають цю статтю!

Найкращі

Рейтинг

Вибране