🚨 速報:プリンストン大学は、わずか36回の会話でほとんど役に立たなかったAIを、非常にパーソナライズされたものに変えました。 AIに「それは間違いだ」と言ったり、同じ質問を二度繰り返したりするたびに、反応が最も価値のあるフィードバックであることを見逃しているのです。 今日構築されているすべてのAIシステムは、この問題を完全に無視しています。 プリンストン大学はこれを解決するOpenClaw RLというシステムを開発しました。 考え方はシンプルです:AIを修正すると、その場でその修正から学習します。エンジニアは関与していません。再訓練はありません。ただ、あなたがすでにしている会話だけです。 モデルは各返信後のあなたの反応を観察します: >再リクエストは失敗を意味します >スムーズな返信がうまくいった証拠です 時間が経つにつれて、あなたが何を求めているのかを正確に把握し、それに合わせて調整していきます。 彼らのテストでは: >、AIアシスタントがほとんど役に立たなかったのが、わずか36回の会話で高度にパーソナライズされたものになりました >採点アシスタントは、わずか24回のやり取りでより温かく詳細なフィードバックを書くことを覚えました 使われるだけで良くなった。 > パーソナライゼーションスコア:0.17 36回の会話後>:0.81 >再訓練もエンジニアも休憩時間もありません >AIがまだ話しかけている間は機能します あなたが今まで打った「違う、そういう意味じゃない」という苛立ちを打つ言葉は、ただの教訓だった。 AIはそれを守らなかっただけです。今までは。