エピプレクシティ、推論、そしてLLMの「異質」な振る舞い: @AnthropicAIのAI研究者であり@nyuniversityの教授である@Pavel_Izmailovとの会話。 00:00 - イントロ 00:53 - エイリアン生存本能:継続的な学習は大きなアライメント問題を引き起こすのか?この投稿を皮肉@iruletheworldmo 03:33 - AIはSF文学から欺瞞を学んだのか? 05:55 - アライメント、スーパーアライメント、OpenAIチームの定義 08:12 - パベルの旅:ロシアの数学からOpenAIのスーパーアライメントへ 10:46 - 文化チェック:OpenAI vs. Anthropic vs. Academia 11:54 - なぜNYUに移ったのか?学術界と探求的研究の必要性 13:09 - 推論はAIのアライメントを難しくするのか、それとも簡単になるのか? 14:22 - 砂袋作り:モデルがバカなふりをすること 16:19 - スケーラブル監督:AIを活用してAIを監督する 18:04 - 弱から強への一般化 22:43 - メカニズティックな解釈可能性:ブラックボックスの内側 25:08 - 推論の爆発 27:07 - トランスフォーマーは十分か、それとも新しいパラダイムが必要か?...