ميزة أداء جديدة ومفيدة: فرز الأقسام أنشئ أرضية أداء لإعطاء الأولوية لنماذج اللغة الكبيرة السريعة، دون أي تأخير
يمكنك تعيين 'preferred_min_throughput' و'preferred_max_latency'. كما في السابق، يمكنك أيضا تحديد سقف تكلفة.
‏‎26‏