Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Etter en uke med de svært positive reaksjonene på Gemini 3, har jeg hatt nok tid til faktisk å kjøre appen daglig i noen dager og føler meg trygg på å gi en liten anmeldelse. Mitt fokus er mer fra et forbrukerperspektiv enn noe annet. Det vil være mange nisjer på forretningssiden hvor enkelte modeller gir mer mening enn andre, men i forbrukerbransjen hadde jeg i praksis antatt at spillet var over og at ChatGPT vant. Er det mulig at forbruker-AI (for det meste kunnskapsinnhenting) snur og Google tar ledelsen? Ender det opp med å bli sterkt duopolistisk? Kanskje enda mer fragmentert? La oss jobbe oss gjennom det.
Jeg har brukt Gemini-appen på iOS før, men egentlig bare som en måte å få tilgang til Veo 3 på. I løpet av den siste uken gikk jeg over til å kjøre appen daglig, og sendte alle mine vanlige spørsmål gjennom den. Resultatet var rundt 15 minutter per dag i appen (omtrent det samme som jeg brukte i ChatGPT historisk).
Det var mye å like med opplevelsen. Jeg synes Gemini 3 gjør en god jobb med å «dimensjonere» responsene sine riktig. Noen spørsmål trenger bare noen få punkter, andre kan kreve flere avsnitt for å besvares tilfredsstillende. ChatGPT har blitt bedre på dette en stund, men Gemini føltes som et steg fremover her. Resultatene føles også raskere enn ChatGPT. Jeg skulle gjerne sett dette kvantifisert for å forstå gapet bedre, men det føltes raskere. Mye av dette har sannsynligvis å gjøre med den innlærte atferden ved modellvalg i ChatGPT. Jeg pleier å lene meg for mye på GPT-5 Pro og burde bare bruke Thinking mer regelmessig.
Nano Banana Pro er en annen sterk differensiator. Den håndterer virkelig komplekse bilder med mye tekst på et helt annet nivå. Det går også veldig raskt. Generativt bilde og video er fortsatt den mest pålitelige måten å trekke meg inn i Gemini-appen på.
Det er ikke perfekt, det er mange ujevne kanter, mer enn jeg ville forventet fra et Google-produkt som har vært kjernen i strategien deres i nesten to år. Jeg følte at appen var ganske dårlig til å opprettholde tilkoblingen til serverne. Jeg fikk rare "frakoblings"-feil og måtte sende inn forespørsler på nytt ganske ofte.
Også stemmetranskripsjonsmodusen (som jeg bruker konstant i ChatGPT) er veldig tøff. Den går ofte glipp av de første ordene du sier etter å ha trykket på knappen, men avbryter deg ofte og sender inn prompten din for tidlig, enten du liker det eller ikke. I ChatGPT har du muligheten til å avslutte en taleopptak og forhåndsvise teksten før du sender. Jeg har ikke funnet ut hvordan jeg gjør det på tvillingene. Jeg håper virkelig de forbedrer denne funksjonen, det er den største dealbreakeren for meg akkurat nå.
Den siste «ulempen» jeg støtte på var hvor vanskelig det er å bytte mellom modaliteter. Hvis jeg genererer et bilde med Nano Banana, virker det som om jeg sitter fast i en slags bildeflyt, og kan ikke gå tilbake til bare å stille spørsmål til Gemini 3. Det føles som om de ulike modellene ikke er samlet, noe som er rart fordi jeg alltid hører mye snakk om «multimodalitet». Kanskje det bare er en UI-feil, men jeg føler at det å gå frem og tilbake mellom tekst og bilder kommer til å være en fantastisk funksjon. "Fortell meg om TEMA" ➜ "Nå visualiser det EMNET."
Jeg antar at jeg vil fortsette å hoppe rundt på AI-apper i overskuelig fremtid, men jeg lurer på om forbrukerne stort sett vil gjøre det samme. Hvis Google ikke hadde så mye produktflate å koble seg til Gemini, ville jeg vært ganske skeptisk, fordi ChatGPT er bare synonymt med «AI» nå, og en bedre modell vil ikke endre på det.
Den største skjørheten i ChatGPT-aggregator-tesen, i hvert fall som jeg personlig opplevde etter byttet, var erkjennelsen av at mange av «lock in»-strategiene rett og slett ikke har lykkes så langt. Jeg savnet ikke de eldre chatloggene mine, jeg følte ikke at de manglet personalisering, jeg etterlot meg ikke et nettverk av forbindelser til ekte mennesker. Disse funksjonene kunne modnes, men det føltes som kjerneinnholdet, hovedgrunnen til å åpne en AI-app i utgangspunktet, var like bra, om ikke bedre, noe som ikke er tilfelle med sosiale nettverk med ekte låsing.
Det er tydelig at Google tar forbruker-AI utrolig seriøst, og med noen få UI-forbedringer kan de ha det beste produktet. Spørsmålet er hvor raskt DAU-er og brukerminutter faktisk vil vokse. Jeg forventer at hvert diagram og datapunkt her blir analysert til døde mens grunnlagsmodellkrigene fortsetter å rase.
Jeg skriver en kort artikkel som dette hver ukedag. TBPN sender det ut i vårt daglige nyhetsbrev, sammen med overskrifter, dagens gjester og dagens innlegg.
Registrer deg for å få den i innboksen din på .
76,57K
Topp
Rangering
Favoritter

