المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
يبدو الأمر غبيا للغاية ، ولكن أحد أكبر الاختراقات الإنتاجية عند استخدام Claude Code مع Opus 4.1 هو: بعد أن تطلب من CC تنفيذ ميزة أو إصلاح خطأ أو أي شيء آخر ، وبعد أن تقول إنها أكملت كل شيء ، ما عليك سوى قول ما يلي مرارا وتكرارا حتى لا تتمكن من العثور على المزيد من الأخطاء (والتي تستغرق أحيانا ما يصل إلى 7 أو 8 محاولات!):
"رائع ، الآن أريدك أن تقرأ بعناية جميع التعليمات البرمجية الجديدة التي كتبتها للتو والتعليمات البرمجية الأخرى الموجودة التي قمت بتعديلها للتو ب "عيون جديدة" ، وتبحث بعناية فائقة عن أي أخطاء أو أخطاء أو مشاكل أو مشكلات أو ارتباك واضحة ، وما إلى ذلك."
نعم ، يستغرق هذا بعض الوقت ، ولكن هذا هو السبب في أنه من السهل جدا فتح مجموعة من جلسات CC في وقت واحد. ثم يمكنك فقط التدوير من خلالها، ولصق هذه الجملة مرارا وتكرارا.
بطريقة ما ، تغير أشياء "العيون الجديدة" كيفية إدراكها لما كتبته للتو بطريقة مفيدة حقا.
الغريب أن هذه الحيلة لا يبدو أنها تعمل بشكل جيد مع تفكير GPT-5 - فهي تميل إلى القول فقط "نعم ، كل شيء يبدو على ما يرام!" كلود أكثر عرضة للتخمين الثاني وارتكاب أخطاء غير مبالية في المرة الأولى ، لكنه جيد في الإمساك بهم إذا أعطيت فرصا كافية.
4.81K
بعد عدة أيام أخرى من الاستخدام المكثف ل GPT-5 عبر المؤشر وعبر طراز GPT-5 Pro في تطبيق الويب ، أقف إلى جانب كل ما قلته عن كونه نموذجا أكثر ذكاء وأفضل في الترميز من Opus 4.1
ما زلت أحب Opus وأجد بيئة العمل في Claude Code أجمل من نواح كثيرة ، ولكن إذا كنت تحاول القيام بأشياء صعبة حقا تتطلب تفكيرا ذكيا حقا في المبادئ الأولى وقطع علوم الكمبيوتر ، فإن GPT-5 هو المستوى التالي.
لكنني أظن أن هذا لا يظهر إلا عندما يتم ضبط وضع جهد التفكير على متوسط على الأقل ، ويتجلى حقا في إعداد الجهد العالي.
ومن الأمثلة الجيدة على المشكلة إعداد "خطوط حمراء" للمستندات لوثيقتين قانونيتين طويلتين ومعقدتين. ليست إصدارات مختلفة من نفس المستند، ولكن مستندان مختلفان يأتيان من قالب عام مشترك.
هذه مشكلة صعبة للغاية للقيام بعمل جيد عليها ، وتتطلب العديد من الحيل والاستدلال الذكي لإعطاء أداء لائق وجودة إخراج (أنا أتحدث عن استخدام تقنيات البرمجة التقليدية هنا ، وليس استخدام LLMs للقيام بهذه المقارنة).
يمكن ل GPT-5 مع عامل المؤشر ببساطة التوصل إلى أفكار أكثر وأفضل وذكية (ولكنها عملية) بشكل أسرع ، وتنفيذها بشكل صحيح وبدون الكثير من الإمساك باليد ، مقارنة ب Opus4.1.
يعتمد ذلك على ما تعمل عليه. ما زلت أعتقد أنني أفضل كود الواجهة الأمامية في NextJS by Opus ، على سبيل المثال.
ولكن يجب عليك التحقق تماما من مشاكلك الفعلية وعدم الوثوق بكل الأشخاص الذين يقولون إن النموذج سيء وأنه دليل على أننا اصطدمنا بالحائط.
إما أنهم يستخدمون الإصدار المجاني السيئ دون تفكير ، أو ليس لديهم أدنى فكرة عن كيفية المطالبة بفعالية ، أو أنهم يتركون مشاعرهم تجاه OpenAI و Altman تلون وجهات نظرهم.
35.97K
أعتقد أن أعلى مجاملة يمكنني تقديمها إلى @patrickc وفريق Stripe هو أن لديهم سمعة طيبة وسجل حافل في صنع واجهة مستخدم / تجربة مستخدم مصقولة وبديهية حقا لخدماتهم بحيث يكون من السهل جدا الإشارة إليها بالاسم في مطالبات الترميز للحصول على نتائج أفضل من وكلاء الترميز الذكاء الاصطناعي.
على سبيل المثال ، لدي نوع مختلف من هذا محفوظ في محرر النصوص الخاص بي ولصقه في كود كلود 10 مرات على الأقل في اليوم:
"أريدك أن تقوم بعمل مذهل في بناء مكونات UI / UX ذات مستوى عالمي تماما لعرض تقارير الدرجات هذه ، وإظهار كل من التفاصيل وأيضا ك" شارات "أو "بطاقات ملخص" ، مع التركيز الشديد على جعل أكثر جاذبية بصريا ، وسهولة في الاستخدام ، وبديهية ، ورائعة ، ومصقولة ، و "مستوى شريط" من جودة واجهة المستخدم / تجربة المستخدم الممكنة لهذا الغرض الذي يستفيد من المكتبات الجيدة التي تعد بالفعل جزءا من المشروع ".
ثم أقول لها أن كل ما صنعه ليس بهذه الروعة حقا ("فظيع الله" أو "سيء بشكل لا يصدق") حتى لو كان جيدا بالفعل ، وأنه يجب تحسينه بشكل كبير للوصول حقا إلى مستويات فئة Stripe من بهجة المستخدم ونعومة ، والتلميع ، والبديهية ، وما إلى ذلك.
في الأساس ، تطبيق تقنية Steve Jobs Gaslighting لتحقيق نتائج "رائعة بجنون" بشكل متكرر.
ونعم ، هذا يعمل بشكل جيد بشكل لا يصدق إذا واصلت القيام بذلك مرارا وتكرارا. الحيلة هي أنك تحتاج إلى تضمين كل تلك الصفات ، وإلا فسوف تتحول إلى أيقونات تدور وتنبض مثل الألعاب البهلوانية ("البقعة" و "الجذابة بصريا") ؛ أنت بحاجة إلى مصطلحات أخرى مثل "مصقول" و "بديهية" و "مستوى شريط" لتلطيف ذلك ، لذا فهو أيضا بسيط إلى حد ما ولطيف للاستخدام في الممارسة.
أنا سعيد لأنني لست مضطرا للعمل معي كوكيل الذكاء الاصطناعي :/
1.7K
ما عليك سوى قراءة ورقة GSPO الجديدة من فريق Qwen.
من المضحك مدى هذه التحسينات النظرية الكبيرة ، على الرغم من وجود أساس أساسي عميق على ما يبدو (في هذه الحالة ، أن التحسين عبر تسلسلات الرموز الرمزية أفضل من التحسين عبر الرموز الفردية) ، تنحصر في النهاية في مجرد السماح للتدرجات بالتدفق بشكل أفضل عن طريق تجنب مشاكل التكييف العددي.
عندما تتراجع خطوة إلى الوراء وتنظر إليها ، فإن GSPO هي في الأساس طريقة للحصول على تكييف رقمي أفضل من خلال حساب متوسط الأشياء معا بشكل أكبر في التحديثات لتجنب المطبات الصاخبة (تقريبا مثل استخدام الزخم في rmsprop أو Adam) وكذلك تجاهل التحديثات التي من شأنها أن تؤدي إلى مواقف "خطيرة" عدديا من حيث التكييف.
لكن كل هذا منطقي من منظور تاريخي ، حيث انفجر التعلم العميق حقا عندما اكتشفنا كيفية تجنب مشكلة التدرج المتلاشي / المتفجر باستخدام أشياء مثل الزخم في المحسنات. لذا ، بطريقة ما ، هذه ببساطة أحدث خطوة في هذا التقليد المتمثل في التنقل في مشهد الخسائر بطريقة أكثر قوة لتجنب "القيادة في حفرة".
3.33K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز