xAI vient de lancer une API de Text to Speech ! 5 voix (eve, ara, rex, sal, leo), balises de discours en ligne, streaming WebSocket, et support de format allant du WAV haute fidélité jusqu'au mulaw téléphonique. Vous pouvez écrire des choses comme : "Alors je suis entré et [pause] là c'était. [laugh] Je ne pouvais vraiment pas y croire !" Ou envelopper des sections : <whisper>C'est un secret.</whisper> Pauses, rires, ricanements, soupirs, respiration, tonalité, vitesse, volume. Un contrôle expressif réel intégré dans le texte lui-même. Trois lignes de curl pour commencer. Pas besoin de SDK. Cela s'associe avec l'API xAI Realtime. Voix entrée, voix sortie, Grok au milieu. L'ensemble de la pile est maintenant là. Tarification bêta. Allez jouer avec ça.