المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
أستاذ مساعد في UIUC CS. سابقا في مختبر ستانفورد DAWN ومختبر بيركلي سكاي.
SWE-bench Verified هو المعيار الذهبي لتقييم وكلاء الترميز: 500 مشكلة في العالم الحقيقي + اختبارات بواسطة OpenAI. يبدو مضادا للرصاص؟ ليس تمامًا.
نظهر اجتياز اختبارات الوحدة != مطابقة الحقيقة الأرضية. في ورقة ACL الخاصة بنا ، قمنا بإصلاح إيفالات عربات التي تجرها الدواب: تحرك 24٪ من الوكلاء لأعلى أو لأسفل لوحة المتصدرين!
1/7

24.88K
سأقدم في جلسة الملصقات 2 في SIGMOD (الأربعاء 16:00 في بوتسدام الثاني). تعال وقل مرحبا!

Daniel Kang24 يونيو 2025
Approximate query processing (AQP) can accelerate long-running analytical queries by orders of magnitude. But why is AQP still rare in production?
To address it, we develop PilotDB, an online AQP middle that makes 0 changes to DBMSs, delivers results with a priori error guarantees, and achieves up to 126x speedup.
1/8
650
يمكن لمعالجة الاستعلام التقريبي (AQP) تسريع الاستعلامات التحليلية طويلة الأمد بأوامر من حيث الحجم. لكن لماذا لا يزال تنظيم القاعدة في القاعدة نادرا في الإنتاج؟
لمعالجة ذلك ، قمنا بتطوير PilotDB ، وهو مركز AQP عبر الإنترنت يقوم بإجراء 0 تغييرات على نظام إدارة قواعد البيانات ، ويقدم نتائج مع ضمانات خطأ مسبقة ، ويحقق تسريعا يصل إلى 126 ضعفا.
1/8
1.52K
سنقدم @ZhanQiusi1 عملنا في جلسة الملصقات يوم الأربعاء الساعة 11 صباحا وورشة عمل Saturday TrustNLP (نقاش تسليط الضوء)! قل مرحبا إذا رأيتها

Daniel Kang13 مارس 2025
يزداد شعبية عوامل الذكاء الاصطناعي (على سبيل المثال ، مشغل OpenAI) ولكن يمكن مهاجمتها لإلحاق الضرر بالمستخدمين!
نظهر أنه حتى مع الدفاعات ، لا يزال من الممكن اختراق عوامل الذكاء الاصطناعي عن طريق الحقن الفوري غير المباشر عبر "الهجمات التكيفية" في ورقة نتائج NAACL 2025
🧵 والروابط أدناه

117
Daniel Kang أعاد النشر
اليوم ، يمكن أن ينشئ الذكاء الاصطناعي الكثير من التعليمات البرمجية - ولكن كيف نعرف ما إذا كان جيدا؟
لهذا السبب قمنا ببناء Sculptor: أول بيئة وكيل ترميز.
يساعدك Sculptor على اكتشاف المشكلات وكتابة الاختبارات وتحسين التعليمات البرمجية الخاصة بك - كل ذلك أثناء العمل في المحرر المفضل لديك.
99.42K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز