Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Дослідження міркувань @OpenAI | Співавтор надлюдських покерних AI Libratus/Pluribus, CICERO Diplomacy AI та OpenAI o3 / o1 / 🍓 міркувань
Може бути важко «відчути AGI», поки ви не побачите, що штучний інтелект освоює домен, який вам глибоко небайдужий. У кожного буде свій момент Лі Седоля в різний час.

Dave White22 лип., 08:59
Новини openAI IMO досить сильно вразили мене цими вихідними
Я все ще перебуваю в гострій фазі удару, я думаю
Я вважаю себе професійним математиком (характеристика, з якою деякі справжні професійні математики можуть не погодитися, але моя партія має мої правила) і не думаю, що можу відповісти на жодне запитання IMO
Гаразд, так, IMO – це свій маленький спортивний підрозділ математики, для якого я не тренувався, і т.д., і т.д., але. якщо я зустрічаю когось у дикій природі, хто має золото IMO, я негайно оновлююся до «ця людина набагато краще розбирається в математиці, ніж я»
Тепер це під силу купі роботів. Для людини, яка багато в чому має свою особистість і своє реальне життя, побудоване на тому, що «добре розбирається в математиці», це удар по нутру. Це свого роду вмирання.
Мовляв, одного разу ви виявляєте, що можете розмовляти з собаками. Це весело і цікаво, тому ви робите це більше, вивчаючи тонкощі їхньої мови та їхні найглибші звичаї. Ви дізнаєтеся, що інші люди здивовані тим, що ви можете зробити. Ви ніколи не вписувалися в колектив, але ви вчитеся, що люди цінують ваші здібності і хочуть, щоб ви допомагали їм. Собаки теж цінують вас, єдиний двоногий, хто дійсно це розуміє. Ви збираєте для себе якусь приналежність. Потім одного разу ви прокидаєтеся, і універсальний перекладач собак продається в Walmart за $4.99
Результат IMO не є новиною, точно. насправді, якщо ви подивитеся на графік тривалості завдання агента METR у часі, я думаю, що агенти, здатні вирішити ~ 1,5 годинні задачі, приходять точно вчасно. Так що в якійсь мірі дивуватися не варто. І справді, схоже, що кілька компаній досягли однакового результату. Це просто... Приплив піднімається так само швидко, як і піднімається
Звичайно, скорбота за моєю особистою ідентичністю як математика (і/або продуктивного члена суспільства) є найменшою частиною цієї історії
Помножте це горе на *кожного* математика, на кожного програміста, можливо, на кожного працівника знань, кожного художника... протягом наступних кількох років... Це трохи більша історія
І, звичайно, крім цього, є страх справжньої смерті, про який я, можливо, розповім пізніше.
Цей пакет - горе за актуальністю, горе за життя, горе за те, що я знав - не є унікальним для епохи штучного інтелекту або чогось подібного. Я думаю, що це стандартна річ, коли людина закінчує кар'єру або закінчує життя. Можливо, для багатьох з нас це настане трохи раніше, і все відразу.
Цікаво, чи готові ми
97,62K
Вітаємо команду GDM з результатом на IMO! Я думаю, що їхній паралельний успіх підкреслює, наскільки швидким є прогрес штучного інтелекту. Їхній підхід дещо відрізнявся від нашого, але я думаю, що це свідчить про те, що є багато напрямків досліджень для подальшого прогресу. Кілька думок про нашу модель та результати 🧵
357,06K
Їхня ставка дозволила використовувати офіційні математичні системи штучного інтелекту (наприклад, AlphaProof). У 2022 році майже ніхто не думав, що LLM може стати золотим рівнем IMO до 2025 року.

Nat McAleese19 лип., 17:47
Ми спостерігаємо набагато швидший прогрес штучного інтелекту, ніж прогнозували Пол Крістіано** та **Юдковський**, які мали золото у 2025 році на рівні 8% та 16% відповідно, за методами, які є більш загальними, ніж очікувалося
164,32K
Нам потрібно кілька місяців, щоб перетворити рубіж експериментальних досліджень на продукт. Але прогрес настільки швидкий, що кілька місяців можуть означати велику різницю в можливостях.

Ravid Shwartz Ziv19 лип., 09:17
Отже, всі моделі поступаються людям у питаннях нової Міжнародної математичної олімпіади, і Grok-4 особливо погано справляється з цим, навіть при виборі best of-n? Неймовірно!

128,35K
Шеріл (@sherylhsu02) була нашою першою найнятою в команду з кількох агентів. За кілька місяців після вступу вона допомогла зробити це можливим. Нам дуже пощастило, що вона є в команді!

Sheryl Hsu19 лип., 15:52
Спостерігати за тим, як модель вирішує ці проблеми IMO та досягає продуктивності золотого рівня, було чарівно. Декілька думок 🧵
114,34K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги