論理的な論理学習はしばしば検証者に依存します。数学には優れていますが、創作や自由な研究には難しいです。 RAROをご紹介します。これは、検証ではなく対抗的なゲームを通じてLLMに推論を教える新しいパラダイムです。 検証者もいない。環境もありません。ただのデモンストレーションだ。🧵👇