トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jason Wei
AI研究者@openai
Jason Wei reposted
2ヶ月前の@Cornellでの私の講義です
「どうすればアウトプットを増やすことができますか?」自然な答えの1つは、「あと数時間働くだけ」です。長時間働くことは助けになりますが、最終的には身体的な限界に達します。
より良い質問は、「インプットをそれほど増やさずにアウトプットを増やすにはどうすればよいか」です。それがレバレッジです。
「レバレッジ」という言葉はよく耳にするので、その意味合いは見落とされがちです。私が個人的に気に入っているレバレッジの分類は、Naval Ravikantによるもの、つまり人間の労働、資本、コード/メディアです。それぞれが歴史上、富の創造の大きな波を動かしてきました。
しかし、レバレッジソースが人気になると(10年前ではなく、現在のYouTubeチャンネルを考えてみてください)、競争によってマージンが圧縮されます。したがって、新しいレバレッジが現れたとき、それは特大の利益を得るまれなチャンスです。
この講演では、AIをその新たなレバレッジとして説明します。AIエージェントは、労働レバレッジ(あなたのために機能し、パーミッションレス)とコードレバレッジ(コピー&ペースト可能)をブレンドします。
AIが莫大な富を生み出すと言うのは決まり文句です。しかし、このレバレッジレンズを使用することで、ノイズの多いAIニュースサイクルを一貫した方法で解釈し、真の機会を見つけることができます。
私をホストしてくれてありがとう@unsojo!
402.41K
検証の非対称性と「検証者の法則」に関する新しいブログ記事:
検証の非対称性(一部のタスクは解決するよりも検証する方がはるかに簡単であるという考え)は、RLが最終的に一般的に機能するようになったため、重要なアイデアになりつつあります。
検証の非対称性の例としては、数独パズル、Instagram などの Web サイトのコード作成、BrowseComp 問題 (答えを見つけるのに ~100 の Web サイトが必要ですが、答えが得られたら簡単に検証できます) などがあります。
他のタスクは、2つの900桁の数字を合計したり、一部のデータ処理スクリプトを合計したりするなど、検証の対称性がほぼあります。しかし、他のタスクは、実行可能な解決策を提案する方が、それを検証するよりもはるかに簡単です(たとえば、長いエッセイの事実確認や、「バイソンだけを食べる」などの新しいダイエットを述べるなど)。
検証の非対称性について理解しておくべき重要なことは、事前に何らかの作業を行うことで非対称性を改善できるということです。たとえば、数学の問題の解答キーがある場合や、Leetcodeの問題のテストケースがある場合などです。これにより、望ましい検証の非対称性に関する一連の問題が大幅に増加します。
「検証者の法則」では、タスクを解決するためのAIのトレーニングの容易さは、タスクの検証可能性に比例すると述べています。解決可能で検証が容易なタスクは、すべてAIによって解決されます。タスクを解決するために AI をトレーニングする能力は、タスクに次のプロパティがあるかどうかに比例します。
1.客観的な真実:誰もが良い解決策が何であるかに同意します
2.検証が速い:任意のソリューションを数秒で検証できます
3.検証にスケーラブル:多くのソリューションを同時に検証できます
4. 低ノイズ:検証は、ソリューションの品質に可能な限り密接に関連しています
5.継続的な報酬:単一の問題に対して多くの解決策の良さをランク付けするのは簡単です
検証者の法則を明白に具体化しているのは、AIで提案されているほとんどのベンチマークは検証が容易で、これまでに解決されているという事実です。過去10年間に人気のあるベンチマークのほぼすべてが基準#1-4に適合していることに注意してください。基準#1-4を満たさないベンチマークは、人気を得るのに苦労するでしょう。
なぜ検証可能性がそれほど重要なのですか?AIで発生する学習量は、上記の基準が満たされたときに最大化されます。各ステップに多くの信号がある多くの勾配ステップを取ることができます。イテレーションのスピードは重要であり、デジタル世界の進歩が物理世界の進歩よりもはるかに速いのはそのためです。
GoogleのAlphaEvolveは、検証の非対称性を活用した最大の例の1つです。これは、上記のすべての基準に適合するセットアップに焦点を当てており、数学やその他の分野で多くの進歩をもたらしています。過去20年間にAIで行ってきたこととは異なり、列車セットがテストセットと同等である設定ですべての問題が最適化されるという新しいパラダイムです。
検証の非対称性はいたるところにあり、測定できるものはすべて解決されるギザギザの知能の世界を考えると、ワクワクします。

298.8K
ストレートバンガー、すぐに読みました

Kevin Lu7月10日 00:01
なぜRLの研究をやめて、製品に取り組むべきなのか //
AIの大きなスケーリングシフトを解き放ったテクノロジーは、トランスフォーマーではなくインターネットです
AIにおいてデータが最も重要なことであり、また、研究者がとにかくデータに取り組まないことを選択することはよく知られていると思います。...データに(スケーラブルな方法で)取り組むとはどういう意味ですか?
インターネットは、豊富なデータの豊富なソースを提供し、それは多様で、自然なカリキュラムを提供し、人々が実際に気にかけている能力を表し、大規模に展開するための経済的に実行可能なテクノロジーでした。
トランスフォーマーがなければ、いくつものアプローチが軌道に乗ったかもしれませんし、GPT-4.5のようなレベルのCNNや状態空間モデルもできたでしょう。しかし、GPT-4以降、ベースモデルに劇的な改善は見られませんでした。推論モデルは狭い領域では優れていますが、2023年3月(2年以上前)のGPT-4ほど大きな飛躍ではありません。
強化学習には素晴らしいものがありますが、私が深く恐れているのは、過去(2015-2020年代のRL)の過ちを繰り返して、どうでもいいRL研究をしてしまうことです。
インターネットが教師あり事前学習の二重であったように、GPT-1 -> GPT-4のような大規模な進歩につながるRLの二重化は何でしょうか?研究と製品の共同設計のように見えると思います。

18.64K
AIの自己改善はまだありませんが、実現すればゲームチェンジャーになるでしょう。GPT-4の時代に比べて知恵が増えた今、それが「速い離陸」ではなく、何年も、おそらく10年にわたって非常に緩やかに行われることは明らかです。
最初に知っておくべきことは、自己改善、つまりモデル自身をトレーニングすることは二元論ではないということです。GPT-5のトレーニングGPT-6のシナリオを考えてみて、これは信じられないことです。GPT-5は、GPT-6を全く訓練できない状態から、突然、非常に熟練した訓練に変わるのでしょうか?絶対に違います。最初のGPT-6トレーニングランは、人間の研究者と比較して、時間と計算が非常に非効率的である可能性があります。そして、多くの試行錯誤を経て初めて、GPT-5は実際に人間よりもGPT-6を訓練することができるようになるのです。
次に、モデルが自分自身をトレーニングできたとしても、すべてのドメインで突然改善されるわけではありません。さまざまな領域で自分自身を向上させるのがどれほど難しいかには、難易度の段階があります。例えば、自己改善は、基本的な幻覚やスタイルなど、トレーニング後に簡単に修正する方法がすでにわかっている領域に対してのみ、最初は機能するのかもしれません。次は数学とコーディングで、これはより多くの作業を必要としますが、モデルを改善するための方法が確立されています。そして、極端な場合、自己改善に非常に難しいタスクがあることを想像できます。たとえば、~500 人が話すネイティブ アメリカンの言語であるトリンギット語を話す能力です。モデルがトリンギット語を話すことを自己改善することは非常に困難であり、このような低リソース言語を解く方法はまだなく、より多くのデータを収集する以外には時間がかかるでしょう。ですから、自己改善の難しさの段階があるため、すべてが一度に起こるわけではありません。
最後に、これは議論の余地があるかもしれませんが、結局のところ、科学の進歩は現実世界の実験によってボトルネックになっています。生物学の論文を全部読めばがんの治療法がわかるとか、MLの論文を全部読んで数学を全部マスターすれば、GPT-10を完璧にトレーニングできると信じている人もいるかもしれません。もしそうなら、最も多くの論文を読み、最も多くの理論を研究した人々が最高のAI研究者となるでしょう。しかし、実際に起こったことは、AI(および他の多くの分野)が容赦なく経験的な研究者によって支配されるようになったことであり、これは、生の知性ではなく、実際の実験に基づく進歩がどれほど進んでいるかを反映しています。ですから、私が言いたいのは、超賢いエージェントは、人間の最高の研究者よりも2倍、あるいは5倍も優れた実験を設計するかもしれませんが、結局のところ、実験が実行されるのを待たなければならないということです。
要約すると、生の知性や自己改善システムだけでなく、進歩には多くのボトルネックがあります。AIは多くのドメインを解決しますが、各ドメインには独自の進行速度があります。そして、最高の知能をもってしても、現実世界での実験が必要です。だから、それは加速であり、速い離陸ではありません、私の暴言を読んでくれてありがとう
339.88K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable