المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
💡 مزودي الاستدلال الرائدون — @basetenco، @DeepInfra، @FireworksAI_HQ، و@togethercompute — يقومون بخفض تكلفة الرمز الواحد بنسبة تصل إلى 10 أضعاف عبر الصناعات التي تحتوي على مجموعات استدلالية محسنة مدعومة بمنصة NVIDIA Blackwell.
من خلال دمج #opensource الذكاء الرائد مع التصميم المشترك بين الأجهزة والبرمجيات من NVIDIA Blackwell، ومجموعات الاستدلال المحسنة الخاصة بهم، يقدم هؤلاء المزودون تخفيضا كبيرا في تكلفة الرموز لشركات مثل @SullyAI وLatitude وSentient وDecagon.
🔗

⚡ مدعومة من NVIDIA Blackwell، تسرع @togethercompute و@DecagonAI خدمة العملاء بالذكاء الاصطناعي — مقدمة تفاعلات صوتية شبيهة بالبشر في أقل من 600 مللي ثانية وتقليل التكاليف بمقدار 6 أضعاف.
مع نظام Together المحسنة للاستدلالات الذي يعمل على NVIDIA Blackwell، تدعم Decagon تجارب الكونسيرج في الوقت الحقيقي على نطاق واسع — حيث تتعامل مع مئات الاستعلامات في الثانية بدقة أقل من الثانية.
🩺 @SullyAI يحول كفاءة الرعاية الصحية من خلال واجهة برمجة تطبيقات نموذج Baseten، التي تشغل نماذج مفتوحة متقدمة مثل gpt-oss-120b على معالجات NVIDIA Blackwell.
مع مكدس الاستدلال المحسنين الذي بنيه باستخدام NVIDIA Blackwell وNVFP4 وTensorRT-LLM وNVIDIA Dynamo، قدم Baseten تخفيضا في التكلفة بمقدار 10 أضعاف واستجابة أسرع بنسبة 65٪ لسير العمل الرئيسي مثل توليد الملاحظات السريرية.
تشغل @basetenco @DeepInfra @FireworksAI_HQ @togethercompute @DecagonAI @sullyai ⚙️ Latitude نماذج واسعة النطاق من مزيج الخبراء على منصة الاستدلال الخاصة ب DeepInfra، مدعومة بمعالجات NVIDIA Blackwell GPU وNVFP4 وTensorRT LLM.
خفضت DeepInfra تكلفة المليون رمز من 0.20 دولار إلى 0.05 دولار — أي زيادة في الكفاءة بمقدار 4 أضعاف.
لإدارة الحجم والتعقيد، يستخدم @SentientAGI منصة الاستنتاج بالذكاء الاصطناعي Fireworks التي تعمل على NVIDIA Blackwell. مع مكدس الاستدلال المحسوب ل Blackwell من @FireworksAI_HQ، حققت Sentient كفاءة تكلفة أفضل بنسبة 25-50٪ مقارنة بنشرها السابق القائم على هوبر.
بعبارة أخرى، يمكن للشركة أن تخدم 25–50٪ مستخدمين متزامنين أكثر على كل وحدة معالجة رسومات بنفس التكلفة. دعمت قابلية التوسع للمنصة إطلاق فيروسي ل 1.8 مليون مستخدم في قائمة الانتظار خلال 24 ساعة، وعالجت 5.6 مليون استفسار في أسبوع واحد مع توفير تأخير منخفض ومتسق.
83
الأفضل
المُتصدِّرة
التطبيقات المفضلة
