最も賢い研究者たちは、USDを最大化することが離陸の究極の報酬関数であるべきだと考えています。しかし、未来を予測することはさらに優れています。 直感のポンプを紹介します: —>ドルではなく、通貨のバスケットです —実際には>商品と資産のバスケット —どの資産を保有すべきか>、その将来の期待効用はどのくらいか —>すべての物質とその将来の有用性を見ます。優先順位付け —>自分自身と現在のツールを将来のユーティリティの一部としてモデル化してください —自己と外面>境界は難しいものではなく、ベイズ的です。「ボールが来る、キャッチしないといけない。腕をコントロールできるんだよね?」 —月の採掘をし>なきゃいけない。「腕を有効にコントロールできるか?いいえ。光速の伝動の問題があるため、半自動運転をするのが良いでしょう。自分の世界モデルでその行動をモデル化し、その行動に対する私の反応をモデル化しなければならない」 —>究極のモデルとは、未来の状態の予測を最大化する宇宙のモデルであり、予測を助ける物質も含まれます