Boże, mieszkańcy RL Prime Intellect tak ciężko pracują. Głównym wąskim gardłem w ciągłym uczeniu się jest to, że nie mamy ogólnego sposobu na porównywanie i ocenianie metod w różnych dziedzinach zadań. Myślę, że @carnot_cyclist może to rozwiązał.
Nie chcę psuć zabawy, ponieważ chcę, aby napisał świetny post na blogu na ten temat. Ale wow, to naprawdę bardzo czysty formalizm, który można wykorzystać do wielu różnych rzeczy, a on ma kilka ładnych wczesnych wyników eksperymentalnych, aby to pokazać.
138