O MetalRT acaba de se tornar o primeiro motor de inferência de IA completo para Apple Silicon: LLM + STT + TTS por @RunAnywhereAI. Já tínhamos a decodificação LLM mais rápida (658 tok/s). Agora também superamos o STT e o TTS, batendo o MLX em todos os aspectos. Os números de hoje no M4 Max: - Podcast de 1 hora transcrito em ~5 segundos - Reunião de 3 horas transcrita em ~15 segundos - Legendas ao vivo com zero atraso perceptível - 714x mais rápido que o tempo real para STT - 4.6x mais rápido que o MLX da Apple em fala-para-texto Todas as três modalidades. Um motor unificado. E isso é apenas os componentes individuais. O pipeline completo de IA de voz que estamos construindo em cima será o MAIS RÁPIDO de sempre no Apple Silicon. Lançamento em breve. Benchmarks completos, gráficos e detalhes nos comentários. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI