المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jason Wei
باحث الذكاء الاصطناعي @openai
Jason Wei أعاد النشر
📣 متحمس لمشاركة دراستنا الواقعية لمساعد الطيار السريري LLM ، وهو تعاون بين @OpenAI و @PendaHealth.
عبر 39,849 زيارة حية للمرضى ، كان لدى الأطباء المصابين ب الذكاء الاصطناعي انخفاض نسبي بنسبة 16٪ في أخطاء التشخيص وانخفاض بنسبة 13٪ في أخطاء العلاج مقارنة بأولئك الذين لا يعانون من ذلك. 🧵
296.97K
Jason Wei أعاد النشر
هذه محاضرتي منذ شهرين في @Cornell
"كيف يمكنني زيادة إنتاجي؟" إحدى الإجابات الطبيعية هي "سأعمل بضع ساعات أخرى". يمكن أن يساعد العمل لفترة أطول ، لكنك في النهاية تصل إلى الحد المادي.
السؤال الأفضل هو ، "كيف يمكنني زيادة مخرجاتي دون زيادة المدخلات بنفس القدر؟" هذا هو الرافعة المالية.
نسمع "الرافعة المالية" في كثير من الأحيان بحيث يسهل التغاضي عن آثارها. تصنيفي الشخصي المفضل للرافعة المالية هو من قبل نافال رافيكانت: العمالة البشرية ، ورأس المال ، والرمز / الوسائط. لقد عزز كل منها موجات كبيرة من تكوين الثروة في التاريخ.
ومع ذلك ، بمجرد أن يصبح مصدر الرافعة المالية شائعا (فكر في قنوات YouTube اليوم مقارنة بعشر سنوات مضت) ، فإن المنافسة تضغط على الهامش. لذلك عندما تظهر رافعة مالية جديدة ، فهي فرصة نادرة لتحقيق مكاسب ضخمة.
في هذا الحديث ، أصف الذكاء الاصطناعي بأنه تلك الرافعة المالية الناشئة. يمزج وكيل الذكاء الاصطناعي بين الرافعة المالية للعمالة (إنه يعمل من أجلك ولا يسمح به) مع الرافعة المالية للكود (يمكنك نسخها ولصقها).
من المبتذل القول إن الذكاء الاصطناعي سيخلق ثروة هائلة. لكن استخدام عدسة الرافعة المالية هذه يتيح لنا تفسير دورة أخبار الذكاء الاصطناعي الصاخبة بطريقة متسقة وتحديد الفرص الحقيقية.
شكرا @unsojo لاستضافتي!
402.42K
منشور مدونة جديد حول عدم تناسق التحقق و "قانون المدقق":
أصبح عدم تناسق التحقق - فكرة أن التحقق من بعض المهام أسهل بكثير من حلها - فكرة مهمة لأن لدينا RL يعمل أخيرا بشكل عام.
من الأمثلة الرائعة على عدم تناسق التحقق أشياء مثل ألغاز سودوكو ، وكتابة الكود لموقع ويب مثل instagram ، ومشاكل BrowseComp (يستغرق ~ 100 موقع للعثور على الإجابة ، ولكن من السهل التحقق منها بمجرد حصولك على الإجابة).
المهام الأخرى لها شبه تماثل في التحقق ، مثل جمع رقمين مكونة من 900 رقم أو بعض البرامج النصية لمعالجة البيانات. ومع ذلك ، فإن مهام أخرى أسهل بكثير في اقتراح حلول مجدية بدلا من التحقق منها (على سبيل المثال ، التحقق من الحقائق في مقال طويل أو ذكر نظام غذائي جديد مثل "أكل البيسون فقط").
من الأشياء المهمة التي يجب فهمه حول عدم تناسق التحقق أنه يمكنك تحسين عدم التناسق من خلال القيام ببعض الأعمال مسبقا. على سبيل المثال ، إذا كان لديك مفتاح الإجابة لمشكلة رياضية أو إذا كانت لديك حالات اختبار لمشكلة Leetcode. هذا يزيد بشكل كبير من مجموعة المشاكل المتعلقة بعدم تناسق التحقق المرغوب فيه.
ينص "قانون المدقق" على أن سهولة تدريب الذكاء الاصطناعي على حل مهمة ما تتناسب مع مدى إمكانية التحقق من المهمة. سيتم حل جميع المهام التي يمكن حلها ويسهل التحقق منها بواسطة الذكاء الاصطناعي. تتناسب القدرة على تدريب الذكاء الاصطناعي على حل مهمة ما مع ما إذا كانت المهمة تحتوي على الخصائص التالية:
1. الحقيقة الموضوعية: يتفق الجميع على ماهية الحلول الجيدة
2. سريع التحقق: يمكن التحقق من أي حل معين في بضع ثوان
3. قابل للتطوير للتحقق: يمكن التحقق من العديد من الحلول في وقت واحد
4. انخفاض مستوى الضجيج: يرتبط التحقق ارتباطا وثيقا بجودة الحل قدر الإمكان
5. المكافأة المستمرة: من السهل تصنيف جودة العديد من الحلول لمشكلة واحدة
أحد النماذج الواضحة لقانون المدقق هو حقيقة أن معظم المعايير المقترحة في الذكاء الاصطناعي سهلة التحقق وقد تم حلها حتى الآن. لاحظ أن جميع المعايير الشائعة تقريبا في السنوات العشر الماضية تناسب المعايير # 1-4 ؛ المعايير التي لا تفي بالمعايير # 1-4 ستكافح لتصبح شائعة.
لماذا تعتبر قابلية التحقق مهمة جدا؟ يتم تعظيم مقدار التعلم في الذكاء الاصطناعي الذي يحدث عند استيفاء المعايير المذكورة أعلاه ؛ يمكنك اتخاذ الكثير من خطوات التدرج حيث تحتوي كل خطوة على الكثير من الإشارات. تعد سرعة التكرار أمرا بالغ الأهمية - وهذا هو السبب في أن التقدم في العالم الرقمي كان أسرع بكثير من التقدم في العالم المادي.
يعد AlphaEvolve من Google أحد أعظم الأمثلة على الاستفادة من عدم تناسق التحقق. يركز على الإعدادات التي تناسب جميع المعايير المذكورة أعلاه ، وقد أدى إلى عدد من التطورات في الرياضيات والمجالات الأخرى. يختلف عما كنا نفعله في الذكاء الاصطناعي على مدار العقدين الماضيين ، إنه نموذج جديد حيث يتم تحسين جميع المشكلات في بيئة تكون فيها مجموعة القطارات مكافئة لمجموعة الاختبار.
عدم تناسق التحقق موجود في كل مكان ومن المثير التفكير في عالم من الذكاء الخشن حيث سيتم حل أي شيء يمكننا قياسه.

298.8K
بانجر مستقيم ، قرأت على الفور

Kevin Lu10 يوليو، 00:01
لماذا يجب عليك التوقف عن العمل على أبحاث RL وبدلا من ذلك العمل على المنتج //
التكنولوجيا التي أطلقت العنان للتحول الكبير في الذكاء الاصطناعي هي الإنترنت وليس المحولات
أعتقد أنه من المعروف أن البيانات هي أهم شيء في الذكاء الاصطناعي ، وأيضا أن الباحثين يختارون عدم العمل عليها على أي حال. ... ماذا يعني العمل على البيانات (بطريقة قابلة للتطوير)؟
قدم الإنترنت مصدرا غنيا للبيانات الوفيرة ، والتي كانت متنوعة ، وقدمت منهجا طبيعيا ، ومثلت الكفاءات التي يهتم بها الناس بالفعل ، وكانت تقنية مجدية اقتصاديا لنشرها على نطاق واسع - أصبحت مكملا مثاليا للتنبؤ المميز التالي وكانت الحساء البدائي لبدء الذكاء الاصطناعي.
بدون المحولات ، كان من الممكن أن ينطلق أي عدد من الأساليب ، وربما كان لدينا CNNs أو نماذج فضائية للحالة على مستوى GPT-4.5. ولكن لم يكن هناك تحسن كبير في النماذج الأساسية منذ GPT-4. تعتبر نماذج التفكير رائعة في المجالات الضيقة ، ولكنها ليست قفزة كبيرة مثل GPT-4 في مارس 2023 (منذ أكثر من عامين ...)
لدينا شيء رائع في التعلم المعزز ، لكن خوفي العميق هو أننا سنكرر أخطاء الماضي (2015-2020 عصر RL) ونقوم بأبحاث RL التي لا تهم.
بالطريقة التي كان بها الإنترنت هو التدريب المسبق الخاضع للإشراف ، ما الذي سيكون ثنائي RL الذي سيؤدي إلى تقدم هائل مثل GPT-1 -> GPT-4؟ أعتقد أنه يبدو وكأنه تصميم مشترك للبحث والمنتج.

18.65K
ليس لدينا تحسين ذاتي لنظام الذكاء الاصطناعي حتى الآن ، وعندما نفعل ذلك سيكون بمثابة تغيير لقواعد اللعبة. مع مزيد من الحكمة الآن مقارنة بأيام GPT-4 ، من الواضح أنه لن يكون "إقلاعا سريعا" ، بل سيكون تدريجيا للغاية عبر سنوات عديدة ، ربما عقد من الزمان.
أول شيء يجب معرفته هو أن التحسين الذاتي ، أي النماذج التي تدرب على نفسها ، ليس ثنائيا. ضع في اعتبارك سيناريو تدريب GPT-5 GPT-6 ، والذي سيكون أمرا لا يصدق. هل سينتقل GPT-5 فجأة من عدم القدرة على تدريب GPT-6 على الإطلاق إلى تدريبه بكفاءة عالية؟ بالتأكيد لا. من المحتمل أن تكون عمليات التدريب الأولى GPT-6 غير فعالة للغاية من حيث الوقت والحوسبة مقارنة بالباحثين البشريين. وفقط بعد العديد من التجارب ، هل سيكون GPT-5 قادرا بالفعل على تدريب GPT-6 بشكل أفضل من البشر.
ثانيا ، حتى لو تمكن النموذج من تدريب نفسه ، فلن يتحسن فجأة في جميع المجالات. هناك تدرج في الصعوبة في مدى صعوبة تحسين الذات في مختلف المجالات. على سبيل المثال ، ربما يعمل التحسين الذاتي فقط في البداية على المجالات التي نعرف بالفعل كيفية إصلاحها بسهولة في مرحلة ما بعد التدريب ، مثل الهلوسة الأساسية أو الأسلوب. التالي سيكون الرياضيات والترميز ، والذي يتطلب المزيد من العمل ولكنه أنشأ طرقا لتحسين النماذج. وبعد ذلك في أقصى الحدود ، يمكنك أن تتخيل أن هناك بعض المهام التي يصعب عليها تحسين الذات. على سبيل المثال ، القدرة على التحدث بلغة Tlingit ، وهي لغة أمريكية أصلية يتحدث بها ~ 500 شخص. سيكون من الصعب جدا على النموذج تحسين نفسه في التحدث بلغة Tlingit حيث ليس لدينا طرق لحل اللغات منخفضة الموارد مثل هذه حتى الآن باستثناء جمع المزيد من البيانات التي قد تستغرق وقتا. لذلك بسبب تدرج صعوبة تحسين الذات ، لن يحدث كل ذلك مرة واحدة.
أخيرا ، ربما يكون هذا مثيرا للجدل ولكن التقدم في العلم في النهاية هو عنق الزجاجة بسبب تجارب العالم الحقيقي. قد يعتقد البعض أن قراءة جميع أوراق علم الأحياء ستخبرنا بعلاج السرطان ، أو أن قراءة جميع أوراق ML وإتقان كل الرياضيات ستسمح لك بتدريب GPT-10 بشكل مثالي. إذا كان هذا هو الحال ، فإن الأشخاص الذين قرأوا معظم الأوراق ودرسوا معظم النظرية سيكونون أفضل الباحثين في الذكاء الاصطناعي. ولكن ما حدث بالفعل هو أن الذكاء الاصطناعي (والعديد من المجالات الأخرى) أصبح يهيمن عليه الباحثون التجريبيون بلا رحمة ، مما يعكس مدى التقدم الذي يعتمد على تجارب العالم الحقيقي بدلا من الذكاء الخام. لذا فإن وجهة نظري هي ، على الرغم من أن الوكيل الذكي الفائق قد يصمم تجارب أفضل بمرتين أو حتى 5 أضعاف من أفضل الباحثين البشريين لدينا ، إلا أنه في نهاية اليوم لا يزال يتعين عليهم انتظار تشغيل التجارب ، والتي ستكون تسارعا ولكن ليس إقلاعا سريعا.
باختصار ، هناك العديد من الاختناقات للتقدم ، وليس فقط الذكاء الخام أو نظام تحسين الذات. سيحل الذكاء الاصطناعي العديد من المجالات ولكن لكل مجال معدل تقدمه الخاص. وحتى أعلى مستوى من الذكاء سيظل يتطلب تجارب في العالم الحقيقي. لذلك سيكون تسارعا وليس إقلاعا سريعا ، شكرا لك على قراءة صخبي
339.89K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز