Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
Asistent profesora na UIUC CS. Dříve působil ve Stanfordské laboratoři DAWN a v Berkeley Sky Lab.
SWE-bench Verified je zlatý standard pro hodnocení kódovacích agentů: 500 problémů z reálného světa + testy od OpenAI. Zní to neprůstřelně? Skoro.
Ukážeme, že prošel jeho jednotkovými testy != odpovídající základní pravdivost. V našem dokumentu ACL jsme opravili chybné evaly: 24 % agentů se posunulo nahoru nebo dolů v žebříčku!
1/7

24,87K
Budu prezentovat na posterové sekci 2 na SIGMOD (středa 16:00 v Postupimi II). Přijďte vás pozdravit!

Daniel Kang24. 6. 2025
Přibližné zpracování dotazů (AQP) může řádově zrychlit dlouhotrvající analytické dotazy. Proč je ale AQP ve výrobě stále vzácný?
Abychom to vyřešili, vyvíjíme PilotDB, online AQP střed, který provádí 0 změn v DBMS, poskytuje výsledky s apriorními zárukami chyb a dosahuje až 126x zrychlení.
1/8
638
@ZhanQiusi1 budeme prezentovat naši práci ve středu v 11 hodin a na sobotním workshopu TrustNLP (spotlight talk)! Pozdrav, pokud ji uvidíš

Daniel Kang13. 3. 2025
Agenti umělé inteligence jsou stále populárnější (např. operátor OpenAI), ale mohou být napadeni a poškodit uživatele!
V našem dokumentu o zjištěních NAACL 2025 ukazujeme, že i s obranou mohou být agenti umělé inteligence stále kompromitováni prostřednictvím nepřímých promptních injekcí prostřednictvím "adaptivních útoků"
🧵 a odkazy níže

109
Datoví inženýři tráví více než 60 % svého času na datových kanálech. Mohou agenti umělé inteligence pomoci?
Představujeme ELT-Bench, první benchmark hodnotící agenty umělé inteligence při budování end-to-end ELT pipelines. Současní agenti SOTA dosahují úspěšnosti pouze 3,9 % - je před námi ještě dlouhá cesta!
1/7

3,99K
Agenti umělé inteligence jsou stále populárnější (např. operátor OpenAI), ale mohou být napadeni a poškodit uživatele!
V našem dokumentu o zjištěních NAACL 2025 ukazujeme, že i s obranou mohou být agenti umělé inteligence stále kompromitováni prostřednictvím nepřímých promptních injekcí prostřednictvím "adaptivních útoků"
🧵 a odkazy níže

4,16K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější