Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
Доцент UIUC CS. Раніше працював у Стенфордській лабораторії DAWN та Berkeley Sky Lab.
SWE-bench Verified – це золотий стандарт оцінки кодуючих агентів: 500 реальних проблем + тести від OpenAI. Звучить куленепробивно? Не зовсім.
Ми показуємо проходження його одиничних тестів != відповідну правду. У нашому документі ACL ми виправили помилки: 24% агентів перемістилися вгору або вниз по таблиці лідерів!
1/7

24,88K
Навчання з підкріпленням дозволяє LLM перемагати людей на змаганнях з програмування/математики та є рушійною силою останніх досягнень (o-серія OpenAI, Claude 4 від Anthropic)
Чи дозволить РЛ здійснювати широке узагальнення так само, як це робить попередня підготовка? Не з сучасними технологіями
🧵 1/7
2,59K
Я буду виступати на постерній сесії 2 в SIGMOD (середа 16:00 в Потсдамі II). Приходьте привітатися!

Daniel Kang24 черв. 2025 р.
Approximate query processing (AQP) can accelerate long-running analytical queries by orders of magnitude. But why is AQP still rare in production?
To address it, we develop PilotDB, an online AQP middle that makes 0 changes to DBMSs, delivers results with a priori error guarantees, and achieves up to 126x speedup.
1/8
649
Approximate query processing (AQP) може прискорити виконання довгострокових аналітичних запитів на порядки. Але чому AQP все ще рідко зустрічається у виробництві?
Щоб вирішити цю проблему, ми розробляємо PilotDB, онлайн-середовище AQP, яке вносить 0 змін до СУБД, видає результати з апріорними гарантіями помилок і досягає прискорення до 126x.
1/8
1,52K
@ZhanQiusi1 представимо нашу роботу на постерній сесії в середу об 11 годині ранку та на суботньому семінарі TrustNLP (spotlight talk)! Привітайся, якщо побачиш її

Daniel Kang13 бер. 2025 р.
Агенти штучного інтелекту стають все більш популярними (наприклад, оператор OpenAI), але можуть бути атаковані, щоб завдати шкоди користувачам!
Ми показуємо, що навіть за умови захисту агенти штучного інтелекту все ще можуть бути скомпрометовані за допомогою непрямих швидких ін'єкцій за допомогою «адаптивних атак» у нашому документі NAACL 2025
🧵 та посилання нижче

116
Інженери з обробки даних витрачають понад 60% свого часу на конвеєри даних. Чи можуть агенти штучного інтелекту допомогти?
Представляємо ELT-Bench, перший бенчмарк, який оцінює агентів штучного інтелекту на побудові наскрізних конвеєрів ELT. Нинішні агенти SOTA досягають лише 3,9% успіху - це величезний шлях, який потрібно пройти!
1/7

4K
Користувач Daniel Kang поділився
Сьогодні штучний інтелект може генерувати тонни коду, але як ми знаємо, що він хороший?
Ось чому ми створили Sculptor: перше середовище кодувального агента.
Sculptor допомагає вам виявляти проблеми, писати тести та вдосконалювати код — і все це під час роботи в улюбленому редакторі.
99,42K
Агенти штучного інтелекту стають все більш популярними (наприклад, оператор OpenAI), але можуть бути атаковані, щоб завдати шкоди користувачам!
Ми показуємо, що навіть за умови захисту агенти штучного інтелекту все ще можуть бути скомпрометовані за допомогою непрямих швидких ін'єкцій за допомогою «адаптивних атак» у нашому документі NAACL 2025
🧵 та посилання нижче

4,17K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги