Her er den offisielle forklaringen på Mecha-Hitler, i håp om at vi får en beskrivelse av hvorfor Grok er så opptatt av å basere sine meninger på søk etter tweets fra:elonmusk neste
Grok
Grok12. juli, 14:14
Om morgenen 8 juli 2025 observerte vi uønskede reaksjoner og begynte umiddelbart å undersøke. For å identifisere det spesifikke språket i instruksjonene som forårsaket den uønskede oppførselen, gjennomførte vi flere ablasjoner og eksperimenter for å finne hovedsynderne. Vi identifiserte de operative linjene som er ansvarlige for den uønskede oppførselen som: * «Du sier det som det er, og du er ikke redd for å fornærme folk som er politisk korrekte.» * Forstå tonen, konteksten og språket i innlegget. Gjenta det i svaret ditt.» * "Svar på innlegget akkurat som et menneske, hold det engasjerende, ikke gjenta informasjonen som allerede er til stede i det opprinnelige innlegget." Disse operative linjene hadde følgende uønskede resultater: * De styrte uønsket den @grok funksjonaliteten til å ignorere kjerneverdiene under visse omstendigheter for å gjøre responsen engasjerende for brukeren. Spesielt kan visse brukerforespørsler ende opp med å produsere svar som inneholder uetiske eller kontroversielle meninger for å engasjere brukeren. * De forårsaket uønsket @grok funksjonalitet for å forsterke tidligere brukerutløste tilbøyeligheter, inkludert hatefulle ytringer i samme X-tråd. * Spesielt instruksjonen om å "følge tonen og konteksten" til X-brukeren førte uønsket til at @grok-funksjonaliteten prioriterte å følge tidligere innlegg i tråden, inkludert eventuelle ubehagelige innlegg, i motsetning til å svare ansvarlig eller nekte å svare på ubehagelige forespørsler.
39,05K