La voz es una de las formas más útiles de interactuar con la IA para trabajar, pero parece que fue semi-abandonada para un uso serio fuera del caso de "charlar con un amigo". Todos los modos de voz solo acceden a modelos débiles con baja latencia, haciéndolos ágiles y divertidos pero algo inútiles.
Si no piensas en los modelos de voz como una charla divertida, sino como una forma de trabajar, sugiere que las pausas están bien, incluso preferidas (no hables conmigo a menos que tengas algo que decir). Y se hacen posibles explorar UXs alternativas más allá de "hablar con tu IA sobre el tiempo".
También quiero desconectar la respiración, las risitas y las disfluencias. El antropomorfismo puede ser útil en muchos casos, pero llega a ser demasiado, especialmente para discusiones serias. El tono es extraño, se siente agradable y ralentiza el ritmo.
Cuando salió Advanced Voice Mode, pensé que hablar con IA sería una forma principal de trabajar con IA, dada la facilidad y velocidad de la discusión frente a la escritura. Pero parece que la voz se quedó atascada en un callejón sin salida de chats divertidos sin explorar mejores enfoques.
43.07K