المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
قمت ببرمجة جهاز حل نهر بوكر مفتوح المصدر خلال عطلة العطلات. الكود مكتوب بالكامل من قبل Codex، وقد أنشأت أيضا نسخة مع Claude Code للمقارنة.
بشكل عام، سمحت لي هذه الأدوات بالتقدم بشكل أسرع في مجال أعرفه جيدا. لكنني شعرت أيضا أنني لا أستطيع الوثوق بهم تماما. كانوا يرتكبون أخطاء ويواجهون أخطاء، لكن بدلا من الاعتراف بذلك، غالبا ما كانوا يظنون أنها ليست مشكلة كبيرة أو أحيانا يحاولون ببساطة خداعي لأظن أن لا شيء خطأ.
في إحدى جلسات التصحيح التي لا تنسى مع كود كلود، سألته، كاختبار للعقلانية، عن القيمة المتوقعة لاستراتيجية "دائما الانسحاب" عندما يكون لدى اللاعب 100 دولار في الرهان. قال لي إنه وفقا لخوارزميتها، السيارة الكهربائية كانت -93 دولارا. عندما أشرت إلى مدى غرابة ذلك، على أمل أن يدرك الجهاز نفسه أن هناك خطأ، طمأنني أن 93 دولارا تقترب من 100 دولار، لذا ربما كان الأمر جيدا. (بمجرد أن طلبت منه أن يأخذ في الاعتبار المانعات كمشكلة محتملة، أقر بأن الخوارزمية بالفعل لم تكن تأخذها في الاعتبار بشكل صحيح.) لم يكن Codex أفضل بكثير في هذا الجانب، وواجه مجموعة من الأخطاء الخوارزمية المميزة (المثيرة للاهتمام) التي اضطررت للعمل عليها بعناية. لحسن الحظ، تمكنت من التعامل مع هذه المشاكل لأنني خبير في حلول البوكر، لكن لا أعتقد أن هناك الكثير من الأشخاص الآخرين الذين كان بإمكانهم النجاح في صنع هذا الحل باستخدام أدوات البرمجة الذكاء الاصطناعي.
أكثر تجربة محبطة كانت في إنشاء واجهة مستخدم رسومية. بعد اثني عشر محادثة، لم يتمكن كودكس أو كود من الوصول إلى الواجهة الأمامية التي طلبتها، رغم أن واجهة كلود كود كانت على الأقل أجمل. أنا غير متمرس في الواجهة الأمامية، فربما ما طلبته لم يكن ممكنا، لكن لو كان هذا هو الحال، أتمنى لو أخبروني أن الأمر صعب أو مستحيل بدلا من تكرار تنفيذ تطبيقات معطوبة أو أشياء لم أطلبها. لقد أبرز لي كيف لا يزال هناك فرق كبير بين العمل مع زميل بشري والعمل مع الذكاء الاصطناعي.
بعد الانتهاء من التنفيذات الأولية وتصحيحها، طلبت من Codex وClaude Code إنشاء نسخ محسنة ل C++. في هذا الجانب، حقق كودكس نتائج جيدة بشكل مفاجئ. كانت نسختها بمستوى C++ أسرع بست مرات من نسخة كلود كود (حتى بعد تكرارات متكررة من التوجيه لمزيد من التحسينات). تحسينات Codex لم تكن جيدة كما استطعت صنعها، لكنني قضيت 6 سنوات من الدكتوراه في صنع بوتات البوكر. بشكل عام، أعتقد أن Codex قامت بعمل مثير للإعجاب في هذا الموضوع.
طلبي الأخير كان سؤال الذكاء الاصطناعي إذا كان بإمكانهم ابتكار خوارزميات جديدة يمكنها حل مشاكل NLTH بشكل أسرع. لم ينجح أي منهما في ذلك، وهو أمر لم يكن مفاجئا. نماذج اللغة الكبيرة تتحسن بسرعة، لكن تطوير خوارزميات جديدة لهذا النوع من الأمور هو مشروع بحثي يستمر لأشهر لخبير بشري. نماذج اللغة الكبيرة ليست في هذا المستوى بعد.

الأفضل
المُتصدِّرة
التطبيقات المفضلة
