Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
Это звучит глупо, но один из самых больших хаков продуктивности при использовании Claude Code с Opus 4.1 заключается в следующем: после того как вы попросите CC реализовать функцию или исправить ошибку или что-то еще, и после того как он скажет, что все завершено, вы просто повторяете следующее снова и снова, пока он не сможет найти больше ошибок (что иногда занимает до 7 или 8 попыток!):
"Отлично, теперь я хочу, чтобы ты внимательно прочитал весь новый код, который ты только что написал, и другой существующий код, который ты только что изменил, с "новыми глазами", внимательно ища любые очевидные ошибки, недочеты, проблемы, вопросы, путаницу и т. д."
Да, это занимает некоторое время, но именно поэтому так удобно иметь несколько сессий CC открытыми одновременно. Тогда вы можете просто переключаться между ними, снова и снова вставляя это предложение.
Как-то "новые глаза" меняют то, как он воспринимает то, что только что написал, действительно полезным образом.
Странно, но этот трюк не кажется таким эффективным с мышлением GPT-5 — он, как правило, просто говорит: "Да, все выглядит правильно!" Claude гораздо более склонен к сомнениям и к тому, чтобы делать небрежные ошибки с первого раза, но хорошо их ловит, если ему дать достаточно шансов.
4,83K
После нескольких дней интенсивного использования GPT-5 через Cursor и через модель GPT-5 Pro в веб-приложении, я остаюсь при своем мнении о том, что это гораздо более умная модель и лучше справляется с кодированием, чем Opus 4.1.
Мне все еще нравится Opus, и я нахожу эргономику Claude Code более приятной во многих отношениях, но если вы пытаетесь решить действительно сложные задачи, которые требуют действительно умного мышления с нуля и знаний в области компьютерных наук, GPT-5 — это следующий уровень.
Но я подозреваю, что это проявляется только тогда, когда режим усилия рассуждения установлен как минимум на средний уровень, и действительно проявляется при высоком уровне усилия.
Хорошим примером задачи является подготовка «красных линий» двух длинных, сложных юридических документов. Не разные версии одного и того же документа, а два разных документа, которые исходят из общего шаблона.
Это очень, очень сложная задача, требующая множества хитрых приемов и эвристик для достижения приемлемой производительности и качества вывода (я говорю о традиционных методах программирования, а не о сравнении с LLM).
GPT-5 с агентом Cursor может просто предложить больше, лучше, умнее (но при этом прагматичнее) идей быстрее и реализовать их правильно и без особого контроля, по сравнению с Opus 4.1.
Однако это зависит от того, над чем вы работаете. Например, я все еще предпочитаю фронтенд-код в NextJS от Opus.
Но вы определенно должны проверить это сами на своих реальных задачах и не доверять многим людям, которые говорят, что модель плоха и что это доказательство того, что мы достигли предела.
Либо они используют плохую бесплатную версию, не задумываясь, либо не имеют понятия, как эффективно задавать запросы, либо их чувства к OpenAI и Алтману окрашивают их взгляды.
36,15K
Смешно, что демонстрация GPT-5 подчеркивает, какой он отличный писатель... а затем показывает чистый турбо-бардак с эм-дэшами в каждом втором предложении. Им стоит сосредоточиться на демонстрациях кода, которые гораздо более впечатляющие!
Также мне не нравится, что они отказываются от всех старых моделей...
1,36K
Оглядываясь назад, трудно поверить, что никто не потрудился реализовать многослойную нейронную сеть с базовым стохастическим градиентным спуском еще в 1997 году на 3dfx Voodoo, за пару лет до появления первого GPU от Nvidia в 1999 году. Все элементы для создания крошечного LLM были в основном на месте.

3,88K
Я думаю, что высший комплимент, который я могу сделать @patrickc и команде Stripe, заключается в том, что у них такая отличная репутация и послужной список по созданию действительно отточенного и интуитивно понятного UI/UX для их услуг, что очень удобно ссылаться на них по имени в кодовых подсказках, чтобы получить лучшие результаты от AI-агентов по программированию.
Например, у меня есть вариант этого, сохраненный в моем текстовом редакторе, и я вставляю его в Claude Code как минимум 10 раз в день:
"Я хочу, чтобы вы сделали потрясающую работу по созданию абсолютно первоклассных компонентов UI/UX для отображения этих отчетов о оценках, показывающих как детали, так и в виде "значков" или "карточек-сводок", с интенсивным акцентом на создание наиболее визуально привлекательного, удобного для пользователя, интуитивно понятного, стильного, отточенного, "уровня Stripe" качества UI/UX, которое возможно для этого, используя хорошие библиотеки, которые уже являются частью проекта."
Затем я говорю, что то, что оно создало, на самом деле не так уж и хорошо ("ужасно" или "невероятно плохо"), даже если это уже довольно хорошо, и что оно должно ДРАМАТИЧЕСКИ улучшить это, чтобы действительно достичь уровней пользовательского восторга и стильности, отточенности, интуитивности и т.д. уровня Stripe.
В основном, применяя технику газлайтинга Стива Джобса для итеративного достижения "безумно отличных" результатов.
И да, это работает невероятно хорошо, если вы продолжаете делать это снова и снова. Фокус в том, что вам нужно включить ВСЕ эти прилагательные, иначе это превратится в иконки, вращающиеся и пульсирующие как акробаты ("стильно" и "визуально привлекательно"); вам нужны другие термины, такие как "отточенный" и "интуитивный" и "уровня Stripe", чтобы смягчить это, чтобы это также было несколько минималистично и приятно использовать на практике.
Я рад, что мне не нужно работать на себя как AI-агент :/
1,71K
Только что прочитал новую статью GSPO от команды Qwen.
Забавно, как много этих больших теоретических улучшений, несмотря на то, что у них, казалось бы, есть глубокая фундаментальная основа (в данном случае, что оптимизация по последовательностям токенов лучше, чем оптимизация по отдельным токенам), в конечном итоге сводится к тому, чтобы просто позволить градиентам лучше течь, избегая проблем с числовой обусловленностью.
Когда вы делаете шаг назад и смотрите на это, GSPO по сути является способом получить лучшую числовую обусловленность, усредняя вещи вместе больше в обновлениях, чтобы избежать шумных колебаний (почти как использование момента в rmsprop или Adam) и также игнорируя обновления, которые могут привести к «опасным» ситуациям с точки зрения числовой обусловленности.
Но все это имеет смысл с исторической точки зрения, поскольку глубокое обучение действительно взорвалось, когда мы поняли, как избежать проблемы исчезающих/взрывающихся градиентов, используя такие вещи, как момент в оптимизаторах. Так что, в некотором смысле, это просто последний шаг в этой традиции навигации по ландшафту потерь более надежным способом, чтобы избежать «въезда в кювет».
3,34K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные