Uczyłem 100 000 fałszywych uczniów przez 2 tygodnie. i wykorzystałem ich do zbudowania najlepszego systemu przygotowawczego AP na świecie. Wziąłem modele Qwen 3 8B i nadałem im symulowaną ludzką pamięć. Teraz każdej nocy tysiące symulowanych uczniów zaczynają z zerową wiedzą o naukach społecznych. Ich jedynym szkoleniem jest nasz adaptacyjny program nauczania. Pracują nad nim, a następnie przystępują do pełnego egzaminu próbnego AP (zaawansowanej kwalifikacji). Pierwsza grupa uzyskała średnią 3 na swoim egzaminie. (~45. percentyl) Następnie agenci przyjrzeli się, gdzie ponieśli porażkę, i poprawili algorytm. Jeszcze raz, i jeszcze raz, i jeszcze raz. Dwa tygodnie później średnia wynosi 4.43 (~80. percentyl) To jest tak szalona liczba, ponieważ program nauczania, przez który przeszli, to TYLKO podstawowa wiedza i zrozumienie. Nigdy nie uczono ich, jak budować argumenty, kontekstualizować dowody, ani nawet nie pokazano im rubryki egzaminacyjnej. ...A mimo to średnio osiągają 80. percentyl na egzaminie, który wymaga tego wszystkiego. W zasadzie zbudowano pętlę sprzężenia zwrotnego uczenia maszynowego dla edtech. Mówiłem o tym na @clawcon i @sxsw w zeszłym tygodniu. To dopiero początek.