ここには何か重要なことが起きていて、それを解明する価値があると思います。 1) ほとんどのモデルは評価にオーバーフィットします。とはいえ、モデルが信頼できる嘘の検出器かどうかを判断するための評価が必要です。そうしないと、無駄な返品にお金を使い果たす前に 2) おべっかを意識し、一般的に従順であることが必ずしも最善とは限りません 3) LLMと人間を混ぜて判断するのは価値があると思います