Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

swyx
Досягайте амбіцій з цілеспрямованістю, інтенсивністю та чесністю
- @smol_ai
- @dxtipshq
- @sveltesociety
- @aidotengineer
- @coding_career
- @latentspacepod
вітаємо Бджілку з тим, що її забрав Amazon; подібно до Blink, Ring, Eero та OFC, новий Claude + Nova + Alexa, я думаю, що @panos_panay збирає досить міцний другий акт апаратної стратегії Amazon щодо штучного інтелекту
зрозумів, що Бі перемагає, коли @dharmesh з'явився до його @latentspacepod гойдалкою

12,31K
причина, через яку LLM-аналіз (і регулювання, і PMing) є важким*
полягає в тому, що відповідні РОЗМІРИ продовжують змінюватися з кожним поколінням моделі Frontier; Недостатньо просто помістити свою вісь X або Y в логарифмічну шкалу та відстежувати закони масштабування, вам потрібно фактично виконати роботу, щоб подумати про те, як моделі структурно відрізняються у 2025 році та 2024 році та 2023 році тощо
Наприклад
Всі зосереджені на Ело протягом 2 років, Ело потрапляє в гру і втрачає авторитет
Всі орієнтувалися на ціну за токен протягом 3 років, моделі міркувань мають 10-40-кратну варіацію вихідних токенів на завдання, ціна за токен втрачає сенс
Збирайте дані скільки завгодно, але якщо ви просто збираєте чисті часові ряди, ви можете втратити з поля зору загальну картину
*(і чому твердження на кшталт «AI engineer — це не річ, тому що всі інженери-програмісти — AI engineers» — це можна і ніколи не буде правильним, хіба що в самому тривіальному сенсі)

Scott Huston22 лип., 08:30
Чи існує загальнодоступна електронна таблиця всіх провідних моделей LLM від різних компаній, яка показує їхні ціни, контрольні бали, оцінки arena elo тощо?
9,72K
Користувач swyx поділився
🆕 Випускаємо весь наш трек RL + Reasoning!
за участю:
• @willccbb, Прайм Інтелект
• @GregKamradt, Премія «Арка»
• @natolambert, AI2/Міжмережеві з'єднання
• @corbtt, OpenPipe
• @achowdhery, Рефлексія
• @ryanmart3n, на замовлення
• @ChrSzegedy, Морф
зі спеціальним 3-х годинним воркшопом від:
@danielhanchen Нелінивості!
Почніть звідси:
Вдалого перегляду на вихідних! І дякую @OpenPipeAI за підтримку та проведення цього треку!

106,66K
Користувач swyx поділився
Якщо, як @sgrove пропонує, специфікації – це код майбутнього, то що таке налагодження?
1) компіляція специфікацій – це процес, коли кодувальник перетворює специфікації на код
2) все більше і більше "компіляції" буде без нагляду, менше ми будемо спостерігати за роботою агента diff за diff, більше spec in, code out
3) Помилки типу -> помилки правди : більшість налагоджувальних робіт полягатимуть у копанні в планах досліджень та впровадження в Markdown, щоб знайти один рядок неправильного контексту, який змушує агента кодування не досягти успіху під час впровадження. Набори тестів, серед іншого, перевірятимуть на правдивість та логічну послідовність.
4) Існує новий різновид вищого порядку "приєднання покрокового налагоджувача", який полягає в тому, щоб спостерігати за тим, як агент крок за кроком реалізує план, щоб точно визначити логічну помилку в специфікації. Коли ви знаходите помилку під час покрокового проходження програми рядок за рядком, ви змінюєте код, перезапускаєте процес і повторюєте, доки він не запрацює. Коли ви знаходите помилку в *специфікації* під час покрокового проходження реалізації, ви переходите до верхньої гілки, виправляєте специфікацію та перезапускаєте *реалізацію*
10,27K
Зараз ми випускаємо по одному треку на день з @aidotengineer conf*. Вчорашній трек RecSys став великим хітом - але, безумовно, найгарячішим треком був наш репортаж про стан MCP, який проводив @Calclavia
Особистий улюблений слайд - це місце, де я зрозумів@AnthropicAI MCP для собак - набагато складніше, ніж я спочатку думав з нашого подкасту з @dsp_ та @jspahrsummers
Погляньте на ці виступи та привітайте своїх улюблених спікерів!
*більшість вже доступні як "не виставлені" через "Повний список відтворення", якщо ви шукаєте

21,68K
«Три речі: глибока дослідницька модель з удосконаленим пошуковим браузером; революційний оператор комп'ютерного використання; і термінал в ізольованому програмному середовищі для виконання математики та коду. Браузер, комп'ютер, термінал... Ви розумієте?
Це не три окремі пристрої.
Це один пристрій, і ми називаємо його Agent».

399
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги