Spent på at artikkelen vår "Open Problems in Mechanistic Interpretability" (lenke i svar) ble akseptert til TMLR. Vi mangler fortsatt forståelse for hvordan dagens sterkeste AI-systemer fungerer!