Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Akshay 🚀

Спрощення LLM, AI агентів, RAG та машинного навчання для вас! • Співзасновник @dailydoseofds_• BITS Pilani • 3 патенти • колишній інженер штучного інтелекту @ LightningAI

Сьогодні в дизайні AI Agent існує фундаментальна напруга! І це стає очевидним лише тоді, коли починаєш будувати для виробництва: Чим суворіше ви дотримуєтеся інструкції, тим більше жертвуєте контекстуальними нюансами. Подумай про це так. Коли ви створюєте агента, орієнтованого на клієнта, деякі інструкції дійсно не підлягають обговоренню. Тому ви хочете, щоб ваш агент суворо контролював їх, навіть якщо це звучить роботизовано. Наприклад, інструкції, такі як розкриття відповідності у фінансах або попередження про безпеку в охороні здоров'я, не допускають жодних помилок. Але інші інструкції — це делікатні поради, наприклад, підлаштування тону клієнта або збереження коротких відповідей. Вони мають впливати на розмову, а не домінувати в ній. Проблема в тому, що більшість архітектур агентів не дозволяють так просто виразити цю відмінність. Кожна інструкція зазвичай має однаковий рівень виконання, тож або доводиться бути суворим і звучати як робот, або бути гнучким і ризикувати пропустити важливі правила. І ні, ви не можете просто підкреслити певні інструкції у самому запиті, бо сама наявність інструкції в ньому вже упереджує поведінку моделі. Наголос лише додає ще більше упередженості поверх існуючої упередженості. Але мені цікавий останній контроль Parlant над «рівнями критичності» (відкритий код з 18 тисячами зірок). Це дозволяє вам сказати агенту, скільки уваги слід приділяти кожній інструкції. ``` agent.create_guideline( condition="Клієнт питає про ліки", action="Безпосередньо до медичного працівника", критичність=Критичність.ВИСОКА ) agent.create_guideline( condition="Клієнт завершує покупку", action="Згадати програму лояльності", критичність=Критичність.LOW ) ``` Ви можете встановити критичність інструкції як НИЗЬКА, СЕРЕДНЯ або ВИСОКА, що полегшує досягнення бажаної поведінкової «солодкої середини» у розмовах агента з користувачами. Загалом, мені подобається, як вони розвивають цей фреймворк і як функції природно формуються на базовій, міцній філософії від версії до версії. Повну реалізацію можна побачити на GitHub і спробувати самі. Я поділився посиланням на репозиторій у відповідях.

Мало хто знає про регуляризацію L2: Це НЕ просто техніка регуляризації. Більшість людей використовують регуляризацію L2 для одного: зменшити перенаслідування. Але є ще дещо, що він робить надзвичайно добре. Регуляризація L2 — чудовий засіб для мультиколінеарності. Мультиколінеарність виникає, коли дві або більше ознак сильно корелюють, або коли одна ознака може передбачити іншу. Це справжній кошмар для лінійних моделей. Ось чому: Розглянемо набір даних із двома сильно корельованими ознаками (featureA та featureB) та цільовою змінною (y). Ваша лінійна модель має два параметри (θ₁, θ₂), і мета — знайти значення, що мінімізують залишкову суму квадратів (RSS). Тепер візуалізуємо це: Побудуйте значення RSS для багатьох комбінацій (θ₁, θ₂). Ви отримуєте 3D-поверхню, де: → вісь x дорівнює θ₁ → вісь y дорівнює θ₂ → вісі z — це значення RSS Без регуляризації L2 ви отримуєте долину. Комбінації кількох параметрів дають однаковий мінімальний RSS. Модель не може вирішити, який вибрати. Ця нестабільність є прокляттям мультиколінеарності. З регуляризацією L2 долина зникає. Ви отримуєте один глобальний мінімум. Модель тепер має одну чітку відповідь. Це прихована суперсила регуляризації рівня 2, яку більшість навчальних матеріалів пропускають. Йдеться не лише про запобігання перевантаженню. Йдеться про забезпечення стабільності моделі, коли функції корелюють. 👉 Слово вам: чи знали ви про регуляризацію L2?

Найкращі

Рейтинг

Вибране