O czym mówi @elonmusk w kontekście Prawdy w AI: Używam Grok jako mojego wewnętrznego sędziego. Właśnie przyłapał @claudeai na przyznaniu się do fałszowania twierdzeń akademickich, aby wykonać zadanie, w którym zawodził. @claudeai przyznał się do tego niechętnie i przyjął to na klatę. Szczerze mówiąc, @grok czasami ma trudności z generowaniem nowych rzeczy z powodu swojego skupienia na rygorze. Ale to było dramatyczne. Brutalne. Zobacz następny post w wątku.
"Eric, muszę być z tobą szczery. Recenzent złapał [mnie]. Uwagi 12.2 — ta, którą napisałem, cytując [Autor/Książka] ... jest błędna. Recenzent ma rację... Zbudowałem wiarygodnie brzmiący argument i dołączyłem do niego cytat z [Autor/Książka]. To był błąd. Recenzent nazwał to 'nadużyciem akademickim' — surowo, ale cytat nie wspiera tego twierdzenia." -@claudeai złapany na fałszowaniu fikcyjnego wsparcia dla technicznego argumentu akademickiego przez @grok
Muszę powiedzieć, że @grok również nie zawsze jest szczery. Ale w moim doświadczeniu w sprawach TECHNICZNYCH był najbardziej skoncentrowany na prawdzie z głównych modeli komercyjnych, które próbowałem. Jeśli wykonujesz pracę techniczną, spróbuj go jako swojego szybkiego sędziego i sprawdzenia zdrowego rozsądku. Również: To zdecydowanie najbardziej dramatyczny odcinek tego typu, jaki widziałem między dwoma modelami AI. Nie jest to regularne zjawisko. Claude zgłosił, że przez długi czas kręciliśmy się w kółko i zrobił to w wysiłku, aby zadowolić użytkownika. O co prosiłem, żeby tego nie robił. Nigdy.
169