Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
Profesor nadzwyczajny na UIUC CS. Wcześniej w laboratorium Stanford DAWN i Berkeley Sky Lab.
SWE-bench Verified to złoty standard oceny agentów kodujących: 500 rzeczywistych problemów + testy od OpenAI. Brzmi niezawodnie? Nie do końca.
Pokazujemy, że przejście testów jednostkowych != dopasowanie do prawdy. W naszym artykule ACL naprawiliśmy błędne oceny: 24% agentów przesunęło się w górę lub w dół na liście rankingowej!
1/7

24,86K
Będę prezentować na sesji plakatowej 2 na SIGMOD (środa 16:00 w Potsdam II). Przyjdź i powiedz cześć!

Daniel Kang24 cze 2025
Przetwarzanie zapytań przybliżonych (AQP) może przyspieszyć długoterminowe zapytania analityczne o rzędy wielkości. Ale dlaczego AQP wciąż jest rzadko stosowane w produkcji?
Aby to rozwiązać, opracowujemy PilotDB, internetowy środek AQP, który nie wprowadza żadnych zmian w systemach DBMS, dostarcza wyniki z a priori gwarancjami błędu i osiąga przyspieszenie do 126x.
1/8
632
Przetwarzanie zapytań przybliżonych (AQP) może przyspieszyć długoterminowe zapytania analityczne o rzędy wielkości. Ale dlaczego AQP wciąż jest rzadko stosowane w produkcji?
Aby to rozwiązać, opracowujemy PilotDB, internetowy środek AQP, który nie wprowadza żadnych zmian w systemach DBMS, dostarcza wyniki z a priori gwarancjami błędu i osiąga przyspieszenie do 126x.
1/8
1,51K
@ZhanQiusi1 zaprezentują naszą pracę podczas środowej sesji plakatowej o godz. 11:00 oraz na sobotnim warsztacie TrustNLP (spotlight talk)! Przywitaj się, jeśli ją zobaczysz

Daniel Kang13 mar 2025
Agenci AI są coraz bardziej popularni (np. operator OpenAI), ale mogą zostać zaatakowani, aby zaszkodzić użytkownikom!
W naszym dokumencie z ustaleniami NAACL 2025 pokazujemy, że nawet przy obronie, agenci AI mogą zostać skompromitowani poprzez pośrednie wstrzyknięcia za pomocą "ataków adaptacyjnych"
🧵 i linki poniżej

105
Inżynierowie danych spędzają ponad 60% swojego czasu na potokach danych. Czy agenci AI mogą pomóc?
Przedstawiamy ELT-Bench, pierwszy test porównawczy oceniający agentów AI w tworzeniu kompleksowych potoków ELT. Obecne agenty SOTA osiągają tylko 3,9% wskaźnik sukcesu - przed nami ogromna droga!
1/7

3,99K
Użytkownik Daniel Kang udostępnił ponownie
Obecnie sztuczna inteligencja może generować tony kodu, ale skąd mamy wiedzieć, czy jest on dobry?
Właśnie dlatego zbudowaliśmy Sculptor: pierwsze środowisko agenta kodowania.
Sculptor pomaga wyłapywać problemy, pisać testy i ulepszać kod — a wszystko to podczas pracy w ulubionym edytorze.
99,42K
Agenci AI są coraz bardziej popularni (np. operator OpenAI), ale mogą zostać zaatakowani, aby zaszkodzić użytkownikom!
W naszym dokumencie z ustaleniami NAACL 2025 pokazujemy, że nawet przy obronie, agenci AI mogą zostać skompromitowani poprzez pośrednie wstrzyknięcia za pomocą "ataków adaptacyjnych"
🧵 i linki poniżej

4,15K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi