xAI hat gerade eine Text-zu-Sprache-API veröffentlicht! 5 Stimmen (eve, ara, rex, sal, leo), Inline-Sprech-Tags, WebSocket-Streaming und Formatunterstützung von hochauflösendem WAV bis hin zu Telefonie mulaw. Du kannst Dinge schreiben wie: "Also bin ich reingegangen und [pause] da war es. [laugh] Ich konnte es ehrlich gesagt nicht glauben!" Oder Abschnitte einrahmen: <whisper>Es ist ein Geheimnis.</whisper> Pausen, Lachen, Schmunzeln, Seufzen, Atmen, Tonhöhe, Geschwindigkeit, Lautstärke. Tatsächliche expressive Kontrolle, die in den Text selbst eingebaut ist. Drei Zeilen Curl, um loszulegen. Kein SDK erforderlich. Das passt zur xAI Realtime API. Stimme rein, Stimme raus, Grok dazwischen. Der gesamte Stack ist jetzt vorhanden. Beta-Preise. Spiel damit!