المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Kirill Balakhonov | Nethermind
منشئ AuditAgent | الذكاء الاصطناعي × التشفير × المنتج | بناء الاقتصاد الوكيل
لماذا أصدرت OpenAI نماذج ذات أوزان مفتوحة؟ لقتل أعمالهم الخاصة ... (أم لا؟)
نعم ، أصدرت @OpenAI للتو نموذجين بأوزان مفتوحة ، مما يعني أنه يمكن للمطورين استخدامها دون دفع أي شيء ل OpenAI. على وجه التحديد ، تم إصداره بموجب ترخيص Apache 2.0 التجاري الأكثر ليبرالية. فلماذا فعلت OpenAI هذا؟ هناك عدة جوانب.
لكن ، أريد أن أوضح أنه عندما تصدر شركة نموذجا بأوزان مفتوحة ، فهذا لا يعني أن النموذج مفتوح المصدر مثل التعليمات البرمجية مفتوحة المصدر التي يمكنك تشغيلها بنفسك ، مثل نظام التشغيل @Linux. لا ، مع نماذج الذكاء الاصطناعي ، الأمر مختلف قليلا. على وجه الخصوص ، النموذج عبارة عن صندوق أسود ، مجموعة من الأوزان. وعلى الرغم من أنه يمكنك اختباره على مهام مختلفة ومعرفة كيفية عمله ، إذا لم تتمكن من إعادة إنتاج عملية التدريب ، فلا يمكنك أبدا معرفة ما إذا كانت هناك أي أبواب خلفية أو ثغرات أمنية انتهى بها الأمر عن قصد أو عن طريق الخطأ داخل هذا النموذج. لذلك دعونا نفصل هذا عن المصدر المفتوح على الفور. لسوء الحظ ، لا يمكن الوثوق بالنماذج ذات الأوزان مفتوحة المصدر تماما (يمكن أن تكون chep على الرغم من ذلك).
الجانب الآخر الذي لاحظته ، كما هو موضح في الصورة ، هو أن جودة النماذج مفتوحة المصدر لا تختلف كثيرا عن نماذج OpenAI الرئيسية المتوفرة فقط من خلال واجهة برمجة التطبيقات. هذا رائع! هذا غير متوقع! هل تعتقد مقدار الأموال التي يمكن أن تخسرها OpenAI من خلال السماح للمطورين باستخدام نماذجهم؟ ومع ذلك ، هذا ليس كل شيء. النماذج ليست كل ما تحصل عليه عند استخدام OpenAI من خلال واجهة برمجة التطبيقات. على سبيل المثال ، عند استخدام ChatGPT عبر واجهة المستخدم واختيار نموذج o3 ، فهناك بالفعل وكيل معقد يعمل تحت الغطاء ، وأثناء استخدام هذه النماذج ، لديه الكثير من المنطق المكتوب في الأعلى للعمل بشكل جيد مع مستنداتك وأدواتك. لا يمكنك الوصول إليها عبر هذه النماذج التي نشرتها OpenAI.
فلماذا أصدرت OpenAI نماذج ذات أوزان مفتوحة؟ أولا ، أصدرت منافسوها الرئيسيون ، وخاصة @Meta و @MistralAI و @deepseek_ai (أوه ، و @Google) ، نماذج تنافسية بأوزان مفتوحة يستخدمها الناس. ولا تزداد شعبية OpenAI بين الأشخاص الذين يستخدمون النماذج المفتوحة. ومع ذلك ، بالنسبة للمطورين الذين يحتاجون إلى كلا النموذجين بأوزان مفتوحة (للحسابات المحلية / الخاصة) جنبا إلى جنب مع النماذج التي يمكن الوصول إليها بواسطة واجهة برمجة التطبيقات (للأشياء الأصعب) ، إذا احتاجوا إلى كليهما ، فلن يتمكنوا ببساطة من استخدام OpenAI. من الأسهل عليهم استخدام منافسيهم مثل Google أو DeepSeek.
ثانيا ، هناك ضغط كبير من كل من المستخدمين والمنظمين الذين يريدون المزيد من الانفتاح. يشعر الناس بالقلق من أن الذكاء الاصطناعي قد يخرج عن نطاق السيطرة أو يقع تحت سيطرة مجموعة ضيقة من الشركات في وادي السيليكون ، ويريد الناس مزيدا من الشفافية. على الرغم من أنني أجرؤ على القول إنه حتى مجرد القلق بشأن المنافسة وانخفاض المبيعات ، فإن مثل هذا التحرك نحو الانفتاح من المحتمل أن يجعل أعمال OpenAI أكبر.
وثالثا ، بالطبع ، هناك نكتة حول اسم شركة OpenAI. انطلاقا من كيفية تطور كل شيء ، كانت الشركة المسماة OpenAI هي شركة الذكاء الاصطناعي الأكثر انغلاقا بين القادة. هذا مضحك في حد ذاته ، لكن هذا تغير الآن. ماذا ترى؟

281
معظم الناس لا يفهمون على الإطلاق كيف يعمل استبدال الأشخاص ب الذكاء الاصطناعي (أو كيف لا يعمل). حتى التسارع بمقدار عشرة أضعاف لكل ما يفعله المتخصص لا يمحو الوظيفة نفسها تلقائيا - إنه يعيد كتابة الاقتصاد من حولها. عندما ينخفض السعر الفعلي للتسليم ، يصبح الطلب الكامن الذي كان يجلس على الرف فجأة قابلا للتطبيق. لم أقابل مطلقا مالك منتج يعتقد أن مهندسيه يشحنون ميزات أكثر مما تحتاجه خارطة الطريق. قائمة الرغبات دائما أطول مما يسمح به عدد الموظفين. اجعل كل ميزة أرخص عشر مرات في البناء ولا تقطع الفرق بمعامل عشرة - فأنت تضيء كل "لطيف" بدت ذات يوم باهظة التكلفة ، بالإضافة إلى منتجات الحقول الخضراء بأكملها التي لم يكلف أحد عناء نطاقها.
تؤكد دراسة حديثة أجرتها @Microsoft حول استخدام مساعد الطيار في العالم الحقيقي نفس النقطة. يأتي المستخدمون للمساعدة في صياغة التعليمات البرمجية أو جمع الحقائق ، لكن النموذج ينتهي به الأمر إلى التدريب وتقديم المشورة والتدريس - طي أنواع جديدة تماما من العمل في جلسة واحدة. المهن ليست متراصة. إنها حزم من العمليات الفرعية ، كل منها يغطيها جزئيا (وبشكل غير كامل) فقط بنماذج اليوم. مع تطور أدوات الذكاء الاصطناعي ، يتطور نطاق الدور معها ، وغالبا ما يتوسع بدلا من الانكماش.
حتى في مدقق العقود الذكي الذكاء الاصطناعي الذي أنشأناه في @NethermindEth ، على الرغم من اسمه ، فإننا نستهدف جزءا محددا جدا من العملية: العثور على نقاط الضعف المحتملة. وفي الوقت نفسه ، يستخدم متخصصو الأمن هذا كأداة ويقومون بعمل أكثر تعقيدا ومتعدد الأوجه - صياغة الاستراتيجيات ، والتحقق من صحة النتائج ، وتصحيح الذكاء الاصطناعي ، وإضافة سياق ضمني ، والتواصل مع المطورين ، واكتشاف النوايا الخفية وإدارة التوقعات.
لذا بدلا من إحصاء الوظائف التي "ستختفي" ، من المفيد أكثر أن نسأل عن المشكلات التي تصبح تستحق الحل بمجرد أن تسقط التكلفة الهامشية لحلها من الهاوية. يشير التاريخ إلى أن الإجابة هي "أكثر بكثير مما يمكننا توظيفه" ، وهذا يجادل من أجل مستقبل يتم فيه إعادة نشر المواهب ومضاعفتها ، وليس جعلها قديمة.


314
يدعم أندريه كارباثي إدخال مصطلح جديد يتعلق ب "هندسة السياق" في تطوير برمجيات الذكاء الاصطناعي باستخدام LLMs.
وقد بدا هذا المصطلح ضروريا للغاية منذ فترة طويلة. في كل مرة أشرح فيها للناس كيف نطور Nethermind AuditAgent الخاص بنا ، فإن أحد الجوانب الرئيسية ، إلى جانب استخدام الخبرة في المجال (أمان web3) واستخدام أفضل نماذج الذكاء الاصطناعي المتاحة (من OpenAI و Anthropic و Google) ، وأدوات LLM ، هو بالضبط "هندسة السياق".
في بعض الأحيان يكون هناك تعبير "السياق هو الملك" ، وهذا صحيح حقا. تعد LLMs ، سواء كانت متقدمة ضخمة أو LLMs صغيرة محسنة ، أداة قوية ، ولكن مثل أي أداة ، إذا كانت في الأيدي الخطأ ، فستحصل على نتائج واعدة أقل بكثير مما يمكنك أن تحصل عليه إذا كنت تعمل معهم بشكل صحيح. وإدارة السياق (أو الهندسة) هي في الواقع مجال معقد وغير موصوف جيدا يتطور باستمرار ، وقد برز حقا كامتداد لمفهوم الهندسة السريعة ، والذي له بالفعل بعض الدلالات السلبية.
بشكل عام ، أدرج Andrej الجوانب الرئيسية المتعلقة بهندسة السياق (في لقطة الشاشة الثانية) ، ولكن في كل مهمة محددة ، يحقق الأشخاص نتائج ممتازة إلى حد كبير من خلال التجربة والخطأ ، في كل مرة يحاولون بشكل رتيب تحديد عناصر السياق الصحيحة المطلوبة حقا في هذه المرحلة من حل المشكلات ، وجمع المعايير لكل مرحلة ، والنظر في المقاييس ، وتقسيم مجموعات البيانات إلى اختبار ، التحقق من الصحة ، وما إلى ذلك ، وهكذا دواليك.
ما رأيك في "هندسة السياق"؟

Andrej Karpathy25 يونيو 2025
+1 ل "هندسة السياق" بدلا من "الهندسة السريعة".
يربط الأشخاص المطالبات بأوصاف قصيرة للمهام التي قد تعطيها LLM في استخدامك اليومي. عندما تكون في كل تطبيق LLM ذو قوة صناعية ، فإن هندسة السياق هي الفن والعلم الدقيق لملء نافذة السياق بالمعلومات الصحيحة للخطوة التالية. العلم لأن القيام بذلك بشكل صحيح يتضمن أوصافا وتفسيرات للمهام ، وبعض الأمثلة على اللقطات ، و RAG ، والبيانات ذات الصلة (ربما متعددة الوسائط) ، والأدوات ، والحالة والتاريخ ، والضغط ... القليل جدا أو من الشكل الخاطئ ولا يمتلك LLM السياق المناسب للأداء الأمثل. الكثير أو غير ذي صلة وقد ترتفع تكاليف LLM وقد ينخفض الأداء. القيام بذلك بشكل جيد غير تافه للغاية. والفن بسبب الحدس التوجيهي حول علم نفس LLM لأرواح الناس.
علاوة على هندسة السياق نفسها ، يجب على تطبيق LLM القيام بما يلي:
- تقسيم المشكلات مباشرة إلى تدفقات التحكم
- حزم نوافذ السياق بشكل صحيح
- إرسال المكالمات إلى LLMs من النوع والقدرة الصحيحين
- التعامل مع تدفقات UIUX للتحقق من الجيل
- أكثر من ذلك بكثير - الدرابزين ، والأمن ، والإيفال ، والتوازي ، والجلب المسبق ، ...
لذا فإن هندسة السياق هي مجرد قطعة صغيرة من طبقة سميكة ناشئة من البرامج غير التافهة التي تنسق مكالمات LLM الفردية (وأكثر من ذلك بكثير) في تطبيقات LLM الكاملة. مصطلح "غلاف ChatGPT" متعب وخاطئ حقا.
371
بالأمس دفعنا منتجا جديدا إلى الإنتاج - I.R.I.S. (ماسح النزاهة وذكاء المخاطر) ، وهو أول عامل الذكاء الاصطناعي على X (Twitter سابقا) الذي:
• يقبل إعادة شراء العقد الذكي أو عنوان العقد المنشور
• يدير الكود من خلال منصة SaaS الخاصة بنا AuditAgent - وهو بالفعل حل رائد في السوق يستخدمه المدققون الخارجيون وفرق التطوير
• ينشر تقرير كامل عن الثغرات الأمنية دون مغادرة الخلاصة الاجتماعية
لماذا؟
• قناة خالية من الاحتكاك. يحصل المطورون على تدقيق حيث يتحدثون بالفعل عن التعليمات البرمجية - بدون نماذج ولا سلاسل رسائل بريد إلكتروني.
• وكيل التدقيق تحت الغطاء. ليس مجرد "محرك مسح" ، ولكن خدمتنا الرائدة التي تدعم عمليات التدقيق في العالم الحقيقي.
• البصيرة في ~ 30 دقيقة. فرز مثالي قبل مراجعة يدوية عميقة.
• تعزيز الدخول إلى السوق. يعرض وكيل Twitter قوة AuditAgent ويوجه المستخدمين إلى النظام الأساسي الكامل.
أول 16 ساعة على المخطط الزمني
✨ 2.7 مليون ظهور
🔥 49 ألف مشاركة
📊 85 ٪ مشاعر إيجابية (214 تغريدة)
🛠️ ≈150 تغريدة تشارك حالات الاستخدام العملية
🔍 33 عملية تدقيق سريعة
📋 38 454 سطرا من التعليمات البرمجية الممسوحة ضوئيا
⚠️ تم اكتشاف 377 ثغرة أمنية
ملاحظة شخصية
قبل عام بالضبط ، انضممت إلى Nethermind بما بدا وكأنه فرضية محفوفة بالمخاطر: "سيصبح الذكاء الاصطناعي جزءا أساسيا من أمان العقود الذكية ، ولكن الأدوات المتخصصة والأصلية لسير العمل هي فقط التي ستساعد المحترفين حقا."
بعد اثني عشر شهرا ، لدينا منتجان قيد الإنتاج - AuditAgent (والآن I.R.I.S. (@UndercoverIRIS) - وتأثير واضح على أمان Web3.
شكرا جزيلا لفريق الذكاء الاصطناعي @NethermindEth بأكمله وإلى @virtuals_io. المثابرة + فرضية قوية + الخبرة المشتركة = النتائج التي يمكن أن تراها الصناعة.
سنستمر في بناء الأدوات التي توفر الأمان للمطورين أولا - حتى يصبح Web3 أكثر أمانا مع كل التزام.

739
عدت للتو من قمة الذكاء الاصطناعي في لندن - ويبدو مشهد الذكاء الاصطناعي للمؤسسات مختلفا تماما عن قرب
3 أشياء أصابتني:
1️⃣ أرفف المنتجات المزدحمة.
وعد كل كشك ب "منصة الذكاء الاصطناعي" التي تناسب بطريقة سحرية أي كومة. لكن امشي على الأرض لفترة كافية وستستمر في سماع نفس الحاظر: الأنظمة القديمة بدون واجهات برمجة التطبيقات ، والبيانات المتناثرة ، ومنطق العمل غير الواضح. سيكون الواقع وحشيا بالنسبة لمقاس واحد يناسب الجميع.
2️⃣ تتألق المتاجر المخصصة بهدوء.
تتمتع الوكالات التي تجمع بين الاستشارات العميقة للمجال والتطوير المخصص السريع بميزة واضحة. يمكنهم السقوط في الوسط الفوضوي ، وخياطة الأشياء معا ، وشحن شيء يعمل بالفعل داخل البنية التحتية الهشة للعميل.
3️⃣ العمل المخصص أصبح أرخص وليس أغلى.
مع نماذج التعليمات البرمجية التي تكتب المحولات والاختبارات والسقالات ، يقوم كبار المطورين الآن بالتنسيق بدلا من الكتابة اليدوية. تجربتنا في الاستخدام المستمر لأدوات الذكاء الاصطناعي داخل المنظمة تؤكد ذلك فقط.
الوجبات الجاهزة
لن يكون الفائزون في الذكاء الاصطناعي للمؤسسات هم الوكلاء الأكثر إشراقا "خارج الصندوق" - سيكونون الفرق الذكية التي يمكنها المشاركة في إنشاء حلول في الوقت الفعلي ، مسترشدين بالقيود الفوضوية للتكنولوجيا القديمة.

268
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز