المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
الناس حقا لا يفهمون مدى السلاح الاستراتيجي التنافسي الذي أصبح عليه المصدر المفتوح وكيف يعمل. كان ألفريد مارشال سيكون فخورا. دائما من الجيد إعادة قراءة الكاتدرائية والسوق.

16 فبراير، 02:24
الجزء الذي سيتجاهله معظم الناس: NVIDIA جعلت كل واجهة برمجة تطبيقات للذكاء الاصطناعي الصوتي سلعة.
تفرض OpenAI رسوما على 0.06 دولار للإدخال في الدقيقة و0.24 دولار للدقيقة من الإخراج لواجهة برمجة التطبيقات في الوقت الحقيقي. تفرض Gemini Live 25 رمزا في الثانية من الصوت. كل شركة ناشئة تبني وكلاء صوتيين تخسر أموالا كبيرة من رسوم واجهة برمجة التطبيقات لكل دقيقة لتشغيل ما هو في الأساس مشكلة خط أنابيب: ASR → LLM → TTS، ثلاثة نماذج مدمجة مع تأخير في كل طبقة.
تستبدل PersonaPlex هذا المسار بالكامل بنموذج 7B واحد. يعمل على طائرة A100 واحدة. الأوزان المفتوحة، ترخيص معهد ماساتشوستس للتكنولوجيا، الاستخدام التجاري مسموح به. زمن الاستجابة النهائي: 0.170 ثانية لأخذ الأدوار، 0.240 ثانية للمقاطعات.
يحصل على درجات أعلى في الواقعية الحوارية مقارنة ب Gemini (2.95 مقابل 2.80 MOS) ويتعامل مع المقاطعات بشكل أفضل من كل نظام تجاري تم اختباره.
هذا يخبرك بكل شيء عن دليل NVIDIA. لا يحتاجون إلى فرض رسوم على النموذج. هم بحاجة منك لشراء بطاقة الرسومات. كل شركة تستضيف PersonaPlex بنفسها بدلا من دفع OpenAI لكل دقيقة هي صفقة أخرى ل A100/H100. كل شركة ناشئة في وكيل صوت تتخلى عن اعتمادها على واجهة برمجة التطبيقات هي عقد بطاقة رسومات مؤسسي آخر.
شركة NVIDIA قدمت صنارة الصيد مفتوحة المصدر لأنها تبيع البحيرة. تم بناؤه على هندسة موشي من كيوتاي، مع تحسين دقيق مع أقل من 5,000 ساعة من البيانات.
هامش الذكاء الاصطناعي الصوتي ينتقل من طبقة التطبيق إلى طبقة الأجهزة. وNVIDIA هي الشركة الوحيدة التي تحقق أرباحا بغض النظر عن أي موديل يفوز.
330,000 تحميل في الشهر الأول. هذا هو الاستيلاء على البنية التحتية متخفي في صورة كرم.
على المدى الطويل، يميل السعر الحدي إلى التحول نحو التكلفة الحدية. في البرمجيات، هذا يعني 0 دولار.
15
الأفضل
المُتصدِّرة
التطبيقات المفضلة
