OpenAI、Anthropic、Google、MetaでAI評価(@HamelHusainと@sh_reya)についてトレーニングしています。 以下が彼らの全プロセスです: 8:27 - なぜみんな評価が必要なのか 15:43 - 誤差解析プロセス 32:18 - LLM審査員 44:52 - メトリクス