Anthropic and Thinking Machinesを用いた新しい研究論文 AI 企業は、モデル仕様を使用して、トレーニング中に望ましい動作を定義します。モデル仕様は、モデルに何をしてもらいたいかを明確に表現していますか?また、フロンティアモデルが異なれば個性も異なるのでしょうか? 私たちは見つけるために何千ものシナリオを生成しました。🧵