La voix est l'un des moyens les plus utiles d'interagir avec l'IA pour travailler, mais il semble qu'elle ait été semi-abandonnée pour un usage sérieux en dehors du cas "discuter avec un ami". Tous les modes vocaux n'accèdent qu'à des modèles faibles avec une faible latence, les rendant rapides et amusants mais un peu inutiles.
Si vous ne considérez pas les modèles vocaux comme une conversation amusante, mais plutôt comme un moyen de travailler, cela suggère que les pauses sont acceptables, voire préférées (ne parlez pas avec moi à moins d'avoir quelque chose à dire). Et d'autres expériences utilisateur au-delà de "parler avec votre IA de la météo" deviennent possibles à explorer.
Je veux aussi désactiver la respiration, les rires et les disfluences. L'anthropomorphisme peut être utile dans de nombreux cas, mais cela devient trop, surtout pour des discussions sérieuses. Le ton est inapproprié et cela semble flatteur et ralentit les choses.
Lorsque le mode voix avancé est sorti, je pensais que parler à l'IA serait un moyen majeur par lequel les gens interagiraient avec l'IA, étant donné la facilité et la rapidité de la discussion par rapport à la saisie. Mais il semble que la voix soit coincée dans une impasse de discussions amusantes sans exploration de meilleures approches.
43,17K