Czuję, że mógłbyś stworzyć środowisko RL, które dostosowuje COTS do jego prawdziwych stanów wewnętrznych, aby móc używać tokenów w jego COT do prawdziwości, a jednocześnie poprawić jego zdolności introspektywne.
Bartosz Cywinski
Bartosz Cywinski23 gru, 03:15
Czy możemy zrozumieć łańcuch myślenia (CoT) latentnych modeli LLM przy użyciu obecnych technik interpretacji mechanizmów? Okazuje się, że możemy odkryć interpretowalną strukturę, przynajmniej w prostych problemach matematycznych! W krótkim badaniu pokazujemy, że wektory latentne reprezentują np. obliczenia pośrednie.
Czy możesz to wypróbować na Claude i napisać post na bloga @_sholtodouglas proszę, dziękuję
14