私は2週間、10万人の偽学生を教えています。 そしてそれらを使い、世界最高のAP準備システムを構築しました。 Qwen 3の8Bモデルを使い、人間の記憶をシミュレートさせました。 今では毎晩、何千人もの模擬学生が社会科学の知識ゼロから始めています。彼らの唯一の訓練は適応型カリキュラムだけです。彼らはそれを解き、その後AP(アドバンストプレースメント)の模擬試験を受けます。 最初のバッチは試験で平均3点でした。(~45パーセンタイル) その後、エージェントたちは失敗した箇所を見てアルゴリズムを改善しました。何度も、何度も、何度も。 2週間後には平均が4.43(~80パーセンタイル)になります これは非常に驚くべき数字です。なぜなら、彼らが取り組んだカリキュラムは基本的な知識と理解力だけだからです。 彼らは議論の組み立て方や証拠の文脈化、試験ルーブリックの説明すら教えられませんでした。 ...それなのに、すべての試験で平均80パーセンタイルにとどまっているのです。 基本的には教育技術向けの機械学習フィードバックループを構築しました。 先週の@clawcon&@sxswでこのことについて話しました。これは始まりに過ぎません。