MetalRT vient de devenir le premier moteur d'inférence AI complet pour Apple Silicon : LLM + STT + TTS par @RunAnywhereAI. Nous avions déjà le décodage LLM le plus rapide (658 tok/s). Maintenant, nous avons également écrasé le STT et le TTS, battant MLX sur tous les fronts. Les chiffres d'aujourd'hui sur M4 Max : - Podcast d'une heure transcrit en ~5 secondes - Réunion de 3 heures transcrite en ~15 secondes - Sous-titrage en direct avec zéro délai perceptible - 714x plus rapide que le temps réel pour le STT - 4,6x plus rapide que le MLX d'Apple sur la conversion de la parole en texte Les trois modalités. Un moteur unifié. Et ce n'est que les composants individuels. Le pipeline complet d'AI vocal que nous construisons au-dessus sera le PLUS RAPIDE jamais sur Apple Silicon. Lancement bientôt. Tous les benchmarks, graphiques et détails dans les commentaires. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI