المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

swyx
تحقيق الطموح بقصد وكثافة ونزاهة
- @smol_ai
- @dxtipshq
- @sveltesociety
- @aidotengineer
- @coding_career
- @latentspacepod
عمل لا يصدق على إخفاء المحاذاة من زملاء بشرية
لقد كنت أبحث عن تفسير شتراوس لسبب استمرار الصين في نشر نماذج مفتوحة بدافع طيبة قلوبهم
إذا كنت تفعل أشياء مثل استخدام النماذج المفتوحة من أجل ، IDK ، تنظيف * مهم * إعادة صياغة بياناتك صناعيا إلى جودة الكتاب المدرسي ، فقد تستورد التحيزات التي لا يمكنك اكتشافها إلا بعد فوات الأوان.
لذلك إذا كنت ترغب في تصدير نظام القيمة الخاص بك إلى بقية العالم ، فهذه هي أقوى أداة Soft Power تم اختراعها منذ هوليوود.
لكي نكون واضحين للغاية ، ليس لدينا دليل فعلي على تحفيز أي من المختبرات الصينية. لكن هذه الورقة هي خطوة واضحة نحو تفسير محتمل.


Owain Evans23 يوليو، 00:06
ورقة جديدة ونتيجة مفاجئة.
تنقل LLMs السمات إلى نماذج أخرى عبر إشارات مخفية في البيانات.
يمكن لمجموعات البيانات المكونة من 3 أرقام فقط أن تنقل حب البوم أو الميول الشريرة. 🧵

23.32K
السبب في أن تحليل LLM (والتنظيم ، و PMing) صعب *
هو أن الأبعاد ذات الصلة تستمر في التحرك مع كل جيل من النموذج الحدودي. لا يكفي مجرد وضع المحور X أو Y في مقياس السجل وتتبع قوانين التحجيم ، عليك فعليا القيام بالعمل للتفكير في كيفية اختلاف النماذج هيكليا في 2025 مقابل 2024 مقابل 2023 وما إلى ذلك
مثل
ركز الجميع على ELO لمدة عامين ، يلعب ELO ويفقد مصداقيته
ركز الجميع على سعر الرموز لمدة 3 سنوات ، ونماذج التفكير لها تباين 10-40x في رموز الإخراج لكل مهمة ، وسعر الرمز المميز يفقد معناه
اجمع البيانات كما تريد ، ولكن إذا كنت تقوم فقط بجمع سلاسل زمنية أصلية ، فيمكنك أن تغفل عن الصورة الأكبر
* (ولماذا عبارات مثل "مهندس الذكاء الاصطناعي ليس شيئا لأن جميع مهندسي البرمجيات هم مهندسو ذكاء اصطناعي" هي COPE ولن تكون صحيحة أبدا إلا بالمعنى الأكثر تافهة)

Scott Huston22 يوليو، 08:30
هل هناك جدول بيانات عام لجميع نماذج LLM الرائدة من شركات مختلفة توضح أسعارها ودرجاتها المعيارية ودرجات الساحة وما إلى ذلك؟
9.91K
swyx أعاد النشر
🆕 إطلاق مسار RL + Reasoning بالكامل!
يضم:
• @willccbb ، الفكر الرئيسي
• @GregKamradt ، جائزة آرك
• @natolambert ، AI2 / الوصلات البينية
• @corbtt ، OpenPipe
• @achowdhery ، انعكاس
• @ryanmart3n ، حسب الطلب
• @ChrSzegedy ، مورف
مع ورشة عمل خاصة لمدة 3 ساعات من:
@danielhanchen الكسل!
ابدأ هنا:
عطلة نهاية أسبوع سعيدة للمشاهدة! وشكرا ل @OpenPipeAI لدعم واستضافة هذا المسار!

106.66K
swyx أعاد النشر
إذا كانت المواصفات ، كما يقترح @sgrove ، هي رمز المستقبل ، فما هو تصحيح الأخطاء؟
1) تجميع المواصفات هو عملية تحويل وكيل الترميز للمواصفات إلى رمز
2) المزيد والمزيد من "التجميع" سيكون غير مراقب ، وأقل مشاهدة عمل الوكيل يختلف عن طريق الفرق ، والمزيد من المواصفات ، وإخراج الكود
3) أخطاء النوع - أخطاء الحقيقة >: سيتم البحث في معظم عمليات تصحيح الأخطاء في خطط البحث والتنفيذ في تخفيض السعر للعثور على سطر واحد من السياق غير الصحيح الذي يجعل عامل الترميز يفشل في النجاح عند التنفيذ. ستتحقق مجموعات الاختبار ، من بين أمور أخرى ، من الحقيقة والاتساق المنطقي.
4) هناك نكهة جديدة ذات ترتيب أعلى تتمثل في "إرفاق مصحح أخطاء خطوة" والتي تراقب الوكيل وهو ينفذ خطة خطوة بخطوة لتحديد الخطأ المنطقي في المواصفات. عندما تجد خطأ عند التنقل عبر برنامج سطرا بسطر، فإنك تقوم بتغيير التعليمات البرمجية وإعادة تشغيل العملية وتكرارها حتى تعمل. عندما تجد خطأ في * المواصفات * أثناء التنقل عبر التنفيذ ، فإنك تنتقل إلى المنبع ، وتصلح المواصفات ، وتعيد تشغيل * التنفيذ *
10.27K
نحن نصدر مسارا واحدا يوميا من @aidotengineer CONF الآن *. حقق مسار RecSys بالأمس نجاحا كبيرا - ولكن إلى حد بعيد كان المسار الأكثر سخونة هو تغطيتنا لحالة MCP ، التي استضافتها @Calclavia
الشريحة المفضلة الشخصية هي المكان الذي أدركت فيه @AnthropicAI Dogfoods MCP - الطريق - أصعب مما كنت أعتقد في البداية من البودكاست الخاص بنا مع @dsp_ و @jspahrsummers
ألق نظرة على هذه المحادثات وامنح مكبرات الصوت المفضلة لديك صيحة!
* معظمها متاح بالفعل على أنه "غير مدرج" عبر "قائمة التشغيل الكاملة" إذا كنت تبحث

21.68K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز