Epiplexity, Rozumowanie i "Obce" Zachowanie LLM-ów: moja rozmowa z @Pavel_Izmailov, badaczem AI w @AnthropicAI i profesorem na @nyuniversity. 00:00 - Wstęp 00:53 - Obce instynkty przetrwania: czy ciągłe uczenie się ma stworzyć poważny problem z dostosowaniem? Rozważania na podstawie posta @iruletheworldmo 03:33 - Czy AI nauczyło się oszustwa z literatury sci-fi? 05:55 - Definiowanie Dostosowania, Superdostosowania i zespołów OpenAI 08:12 - Droga Pawła: Od rosyjskiej matematyki do Superdostosowania OpenAI 10:46 - Sprawdzenie kultury: OpenAI vs. Anthropic vs. Akademia 11:54 - Dlaczego przeprowadzić się do NYU? Akademia i potrzeba badań eksploracyjnych 13:09 - Czy rozumowanie utrudnia czy ułatwia dostosowanie AI? 14:22 - Sandbagging: Kiedy modele udają, że są głupie 16:19 - Skalowalny Nadzór: Wykorzystanie AI do nadzorowania AI 18:04 - Słaba do silnej generalizacja 22:43 - Mechanistyczna interpretowalność: Wewnątrz czarnej skrzynki 25:08 - Eksplozja rozumowania 27:07 - Czy Transformatory są wystarczające, czy potrzebujemy nowego paradygmatu?...