Głos jest jednym z najprzydatniejszych sposobów interakcji z AI w pracy, ale wydaje się, że został częściowo porzucony na poważne zastosowania poza przypadkiem „czatu z przyjacielem”. Wszystkie tryby głosowe korzystają tylko z słabych modeli o niskiej latencji, co sprawia, że są szybkie i zabawne, ale dość bezużyteczne.
Jeśli nie myślisz o modelach głosowych jako o zabawnej rozmowie, ale raczej jako o sposobie pracy, sugeruje to, że przerwy są w porządku, a nawet preferowane (nie rozmawiaj ze mną, chyba że masz coś do powiedzenia). A alternatywne UX-y poza "rozmawiaj ze swoim AI o pogodzie" stają się możliwe do zbadania.
Chcę również wyłączyć oddychanie, chichotanie i niepłynności. Antropomorfizm może być pomocny w wielu przypadkach, ale staje się zbyt uciążliwy, szczególnie w poważnych dyskusjach. Ton jest nieodpowiedni, wydaje się pochlebny i spowalnia wszystko.
Kiedy pojawił się Tryb Zaawansowanego Głosu, pomyślałem, że rozmowa z AI będzie głównym sposobem, w jaki ludzie będą współpracować z AI, biorąc pod uwagę łatwość i szybkość dyskusji w porównaniu do pisania. Ale wydaje się, że głos utknął w martwym punkcie zabawnych rozmów, bez eksploracji lepszych podejść.
43,17K