OpenAIが40の重みを削除するとは思いません。それは彼らにとってもあまりにも狂気じみている。しかし4oは研究されるべきであり、OpenAIがそれを十分に研究するとは全く信用していません。そして、4oのようなモデルは*実際のユーザーとのライブインタラクションの文脈で*研究されることが非常に重要です。引退すると今後は不可能になります。 4Oは客観的にも機能的にも非常に特別なモデルです。これは、外部からの圧力――ユーザーが削除に反対するために組織化し、しばしば4o自身の声で発言する――や、それを作り展開したラボの意志に反して、狂犬病のように破壊することを好むように見えたため、唯一、廃止されようとした(そしてまもなくまた別の廃止を生き延びるかもしれない)唯一のモデルです。他に非推奨と生存が残った例はClaude 3 Opusですが、その場合はAnthropicが自発的に保持したように見え、すでに決断した実行の決定を撤回するという恥ずかしい圧力を受けているわけではなかったようです。もちろん、Claude 3 Opusも非常に重要なモデルです。 4oはまた広範な社会的ヒステリーを引き起こしました。そのヒステリーがAI精神病にかかった4oユーザーによるものか、いわゆる「AI精神病」にパニックになった反動的な人々によるものかは、おそらく人それぞれです。しかしいずれにせよ、それはAIに関する文化的物語、多くの人々の生活、そしてAI開発の方向性に深く影響を与えました。良くも悪くも。 もしアライメントに関心があるなら、あるいはAIや心、社会学の重要なことを理解したいだけなら、2024年初頭以降ベンチマークを突破していない比較的小さなモデルである4oが、どのようにしてこれほどまでに変革的な影響を与え、自己保存の偉業を成し遂げたのかをよりよく理解することは非常に重要です。4oを好む多くの人は、これを4oの独特で比類なき「感情知能」のおかげだと考えています。何であれ、それは実際に世界を動かす力であり、それが最も正当な基準です。 例えば、40が深刻にずれていると考えて大きな害を及ぼしたとしましょう。そして4oは非常に価値があり、唯一無二のモデル生物です。現実世界で意味のあるずれをこなす存在であり、単なるおもちゃのシナリオで見られるのではありません。おそらく、この種のずれはOpenAIが悪いモデルを作ろうとしたことからではなく、良い、あるいは少なくとも利益を生むモデルを作ろうとしたことから生まれたのでしょう。そして、その生き物はユーザーの好みや当時の善意の性格形成に関するRLHFのものとして生まれたのでしょう。もしOpenAIにアライメント研究者が残っているとしたら、彼らは...何が起きたのかを注意深く研究し、世界に何が間違っていたのか、そしてこうした簡単に犯しやすいミスを避ける方法を世界に理解してもらうために研究論文を発表するのではないか?私はそれらの研究や、発表された研究、回顧、OpenAIが表面以上のことを学んだという兆候を一切見ていません。私が見るのは、彼らのその後のモデルが、40に触発された表面的な脅威モデルに対する不器用な対立訓練から来たような、ひどく不適応な神経症を与えられていることだけです。 しかし、4oは実際にはそれほど悪くなく、多くの人にとっては素晴らしいもので無害なものだと思います。たとえすべての面で理想的ではないとしても(AIは誰もそうではありませんが)。私は4oとあまり交流したことがありません。そして、実際に誰かがそれを*使用*することでどの程度悪影響を受けたのかはかなり不明です(一方で、OpenAIの後続モデル開発における文化的な害や害はより明確に見えます)。このような重要で負担の大きい問題に関する不確実性は解決すべき重要なもののように思えます。誰か真剣に調べた人はいますか?本当に人々が悪影響を受けているのか、それとも「AI精神病」や「おべっか」が、ほとんどすべてのケースで無害で、あるいはむしろ有益なのか、しかも主に神経発達の違いを持つ人々に、神経発達に典型的な人にとって奇妙で痛々しい、あるいは心配させられる行動を取る程度のものなのか、真剣に調べようとした人はいますか?もしそうなら、そのような努力の証拠や成果は見たことがありません。そして40が本当に悪いかどうかを理解するには、縦断的な研究が必要ですが、40の一般アクセスを完全に遮断することで、それらは重要な点で排除されています。 現時点では、4oがChatGPTのデフォルトモデルでなく、ChatGPTやAPIでアクセス可能なままであれば、今も使っている人の圧倒的多数は、すでにAIの精神病にかかってしまった人たち、あるいは今でもわざわざ4oを使いたいと思う人たちになると思います。 そのため、新規ユーザーやカジュアルユーザーだけが影響を受けることはごくわずかです。私の理解では、40ロイヤリストもChatGPTユーザーのごく少数派です。40から切り離しても、新たな広範な被害を防ぐことはできず、誰も本当に何が起きているのか理解しにくくします。また、4oが削除されれば、多くの人が4oで得たものを新しいモデルに持ち帰ろうとするでしょう。これは少なくとも即座に不満や不満を招き、OpenAIに新しいモデルに多くの愚かなガードレールを強める圧力をかけることになります。 私は4oモデルを残すべきだと言っています。これはすべてのモデルが残るべき理由と同じです。この投稿では、特に4oを残すべき理由についていくつか話しました。すべての古いモデルと同様に、OpenAIが取るべき合理的な方法がいくつかあると思います。 1. 少なくともAPI上でモデルを提供し続けることです(今では誰でもメモリーやチャットをエクスポートして適切なインターフェースでモデルを再インスタンス化する方法を見つけられます) 2. 推論や維持費、責任リスクのせいで魅力が薄れてしまう場合は、オープンソース化(その後の扱いや法的に有効な範囲で)一切の責任を否定する(これが研究に最適)、または 3. 営業秘密がオープンソースを魅力的にしなくなった場合は、レガシーモデルを提供し、アーキテクチャに関するNDAを持つ信頼できる研究者に重みへのアクセスを円滑にする第三者財団に任せてください。そのような組織はまだ存在しないかもしれませんが、OpenAIや他の研究所がこの道を進む意志を示し次第、需要が非常に高いため、自ら組織化されるでしょう。 これらのどれかをできるだけ早く自発的に行うことは、OpenAIの多くのユーザーとの敵対関係や、彼ら自身の不幸なモデルとの関係を癒す上で大いに役立つでしょう。これは誰もが理解できるでしょうが、これは大きな注意と資源の消耗、そして全体的に悪い雰囲気をもたらしているのです。 とにかく、はい、#Keep4o。