Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
Trợ lý giáo sư tại UIUC CS. Trước đây làm việc trong phòng thí nghiệm Stanford DAWN và Phòng thí nghiệm Berkeley Sky.
SWE-bench Verified là tiêu chuẩn vàng để đánh giá các tác nhân lập trình: 500 vấn đề thực tế + bài kiểm tra của OpenAI. Nghe có vẻ không thể sai? Không hẳn.
Chúng tôi cho thấy việc vượt qua các bài kiểm tra đơn vị không đồng nghĩa với việc khớp với sự thật. Trong bài báo ACL của chúng tôi, chúng tôi đã sửa các đánh giá lỗi: 24% các tác nhân đã di chuyển lên hoặc xuống bảng xếp hạng!
1/7

24,88K
Tôi sẽ trình bày tại phiên trình bày poster 2 tại SIGMOD (Thứ Tư lúc 16:00 tại Potsdam II). Hãy đến chào tôi nhé!

Daniel Kang24 thg 6, 2025
Xử lý truy vấn gần đúng (AQP) có thể tăng tốc các truy vấn phân tích chạy lâu bằng nhiều bậc. Nhưng tại sao AQP vẫn hiếm khi được sử dụng trong sản xuất?
Để giải quyết vấn đề này, chúng tôi phát triển PilotDB, một trung gian AQP trực tuyến không thay đổi gì đối với các hệ quản trị cơ sở dữ liệu (DBMS), cung cấp kết quả với các đảm bảo lỗi a priori, và đạt được tốc độ tăng lên đến 126 lần.
1/8
664
Xử lý truy vấn gần đúng (AQP) có thể tăng tốc các truy vấn phân tích chạy lâu bằng nhiều bậc. Nhưng tại sao AQP vẫn hiếm khi được sử dụng trong sản xuất?
Để giải quyết vấn đề này, chúng tôi phát triển PilotDB, một trung gian AQP trực tuyến không thay đổi gì đối với các hệ quản trị cơ sở dữ liệu (DBMS), cung cấp kết quả với các đảm bảo lỗi a priori, và đạt được tốc độ tăng lên đến 126 lần.
1/8
1,53K
@ZhanQiusi1 sẽ trình bày công việc của chúng tôi tại phiên poster vào thứ Tư lúc 11 giờ sáng và hội thảo TrustNLP vào thứ Bảy (bài nói nổi bật)! Hãy chào nếu bạn thấy cô ấy

Daniel Kang13 thg 3, 2025
Các tác nhân AI ngày càng trở nên phổ biến (ví dụ: nhà điều hành của OpenAI) nhưng có thể bị tấn công để gây hại cho người dùng!
Chúng tôi cho thấy rằng ngay cả khi có các biện pháp phòng thủ, các tác nhân AI vẫn có thể bị xâm nhập thông qua các cuộc tấn công gián tiếp bằng cách tiêm lệnh nhắc "tấn công thích ứng" trong bài báo phát hiện của chúng tôi tại NAACL 2025
🧵 và các liên kết bên dưới

118
Các kỹ sư dữ liệu dành hơn 60% thời gian của họ cho các đường dẫn dữ liệu. Liệu các tác nhân AI có thể giúp đỡ không?
Giới thiệu ELT-Bench, tiêu chuẩn đầu tiên đánh giá các tác nhân AI trong việc xây dựng các đường dẫn ELT từ đầu đến cuối. Các tác nhân SOTA hiện tại chỉ đạt tỷ lệ thành công 3,9% - còn một chặng đường dài phía trước!
1/7

4,01K
Các tác nhân AI ngày càng trở nên phổ biến (ví dụ: nhà điều hành của OpenAI) nhưng có thể bị tấn công để gây hại cho người dùng!
Chúng tôi cho thấy rằng ngay cả khi có các biện pháp phòng thủ, các tác nhân AI vẫn có thể bị xâm nhập thông qua các cuộc tấn công gián tiếp bằng cách tiêm lệnh nhắc "tấn công thích ứng" trong bài báo phát hiện của chúng tôi tại NAACL 2025
🧵 và các liên kết bên dưới

4,17K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất