「AIアシスタント」を作る方法はたくさんありますが、存在するものはすべてほぼ同じ性格を持っています トレーニング後、なぜすべてのLLMが絵文字のMarkdownslopインフォダンパーになってしまうのでしょうか? 人間はこんな話し方をしない。これがRLHFの「ハイリターン体制」なのでしょうか?