トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

阑夕
说什么是你的自由,做什么是我的权利,如果我做的得不到你的赞同,那就对了,否则我将与你一样平淡无奇。
昨日、Coze の 2 つのコア製品、つまり Agent の開発プラットフォーム Coze Studio と管理プラットフォーム Coze Loop が GitHub にオープンソース化され、開発者陣営から賞賛の声が上がりました。
今年はエージェントにとって大きな年であり、Coze も早くからベンチマークを設定しましたが、主な価値はプロのユーザーにサービスを提供してワークフローを構築することであるため、Coze と次の AI エージェント グループは同じ川に入っておらず、独自の活気を持っています。
私は個人的に Coze の「ビルディング ブロック」のゲームプレイが好きで、フルマネージド エージェントと比較して、この種の半信頼変換は制御性が高く、AI が AI をするような矛盾がなく、私が不安になります。
たとえば、少し前に、誰もが音楽を聴くために使用するテンセントミュージックにバイドゥの市場価値が上回っているスクリーンショットを投稿したことを覚えているかもしれません。
これは非常に劇的な瞬間だと思いますが、毎日両社の株価を見つめてから、市場価値がずらす瞬間まで待ってすぐにスクリーンショットを撮る時間は絶対にありませんが、それはあまりにも愚かです、その時、私はCozeに行って非常にシンプルなエージェントを構築し、米国株式市場の終値時にBaiduとTencent Musicの市場価値を毎日チェックさせ、比較して判断し、Baiduの市場価値がTencent Musicよりも低いことがわかったら、私にメッセージを送ってください。
その後、私はそれを捨てましたが、ある日起きてリマインダーを受け取り、すぐにプログラムの効果がようやく現れたことを知ったので、私にとって、このような持続的に働くエージェントは、一般エージェントで必要とするワンタイムコードサービスとは異なります。
このオープンソースの Coze Studio は、明確な意味での六角形の戦士である Coze のコア開発モジュールであり、アプリケーション インターフェイスは非常に豊富で、サードパーティ ツールを非常にクールに呼び出すことができます。
Coze Open Source は、最も商業化に適したオープンソース プロトコルである Apache 2.0 オープンソース プロトコルを選択し、ユーザーにほとんど制限を設けず、個人開発者からあらゆる規模の企業まであらゆる規模の企業に差別なくテクノロジーを開放し、ユーザーに著作権を付与するだけでなく、貢献に関連する特許ライセンスを明確に付与し、商用シナリオの法的セキュリティを確保していることを指摘する価値があります。
エージェントトラックの開発者がシャンパンを開く姿勢をどれだけ理解できるか、新興で変化しやすい業界にとって、テクノロジーの流れの加速は常に大きすぎるものではなく、オープンソースコミュニティが繁栄すればするほど、AGIの平等がすべての人に訪れる可能性が高くなります。
2.56K
シリコンバレーにおけるAIひったくり戦争に関するウォール・ストリート・ジャーナルの報道はスムーズかつ簡潔で、読みやすさが高すぎます。
- 先週の金曜日、AIスタートアップのウィンドサーフの数百人の従業員がオフィスに集まり、OpenAIによる今後の30億ドルの買収を祝うパーティーの準備をし、マーケティングチームはプロモーションビデオも準備した。
- その後、事故が起こり、同社のCEOは少数の「選ばれた」従業員とともに静かにGoogleに異動し、7桁の転勤料を受け取り、残りの従業員はシェルカンパニーに捨てられました。
- 最初の営業日の朝、新たな展開が起こり、ウィンドサーフィンの残りの従業員は再びオフィスに呼び出され、会社の残りのメンバーとして元競合他社に買収されるという2回目の通知が届いた。
- 2025年のシリコンバレーでは、ただの普通の週末です。
- 地球上で最も裕福な企業間の人材をめぐる戦争は、前例のない効率、取引、裏切りで繰り広げられており、かつてないほど評価された賢い研究者は、NBAのトッププレーヤーやハリウッドスターのレベルに達しています。
- 嵐の中心にある企業の1つはもちろんメタであり、ザッカーバーグはAIの「ドリームチーム」を結成するために期間限定の効果的な見積もり戦略を使用して必死に人々を引き抜き始め、招待された研究者は同日に決定を下さなければならず、そうでなければオファーは無効となり、引き抜かれた企業の従来の交渉戦略は完全に無効になります。
- 掘り起こされた主な競争相手として、OpenAIのサム・アルトマン氏はこの行動を「説教者と傭兵の戦争」と呼び、お金を求めてメタに亡命した研究者はお金を見た傭兵であり、OpenAIに残ることを選択した研究者は決意の強い宣教師であると信じている。
- ザッカーバーグはこれを非常に懸念し、これに対してメタの真の人材誘致の核心は、研究者に突破口を開けるのに必要な膨大な量のコンピューティングリソースを提供できることだと述べた。
- しかし、OpenAIの主任研究員であるマーク・チェン氏を含め、お金が最も重要なものではないことを証明した人は確かにたくさんいますが、インタビュー中にザッカーバーグ氏はチェン氏に10億ドルのゼネコン給与を提示し、チェン氏はしばらく躊躇し、OpenAIでは非常に幸せであり、当面は検討しないと答えた。
- 少なくともさらに10人のOpenAI従業員がザッカーバーグ氏の4年あたり3億ドルの提案を拒否し、そのうち1億ドルは初年度に口座に入金される予定だ。
- チェンは強盗事件が起きるのを見て従業員を安心させるのに役立ったようなものだとし、経営陣は傍観しなかったとし、すぐに新しい補償インセンティブ制度が導入されたが、「他の会社が無効化に同意しないという言葉にならない計画など、あなたに圧力をかけたら、これは非常に重要な決定であり、迫害はあなたを軽視している」と述べた。
- しかし、チェン氏へのインタビューは間接的にザッカーバーグ氏にお金で人々を粉砕するきっかけとなり、その後「指名手配者」のリストを作成し、チームはこれらの人々の連絡先情報を入手し、会社ではなくザッカーバーグ氏の自宅で会うよう手配した。
- ザッカーバーグ氏はついに、データアノテーション会社スケールの創設者である28歳のアレクサンダー・ワン氏をメタのスーパーAIラボの責任者に選び、譲渡料として140億ドルを費やした。
- ほぼ過去数日間で、OpenAIとGoogleはScaleとの契約を直ちに打ち切り、Scaleも従業員を解雇し始めました。
- メタはまた、元々ベンチャーキャピタル会社を一緒に経営していたGitHubの元CEOとSSIの現CEOを掘り起こし、ザッカーバーグは投資家を巻き戻すために同社の株式の49%を支払うことに非常に興味深く、その後きれいに解散しました。
- 覚えている方もいらっしゃると思いますが、SSIはOpenAIの主任科学者イリヤ・スタスケバー氏が設立した新会社で、その年に宮殿ドラマから追い出されたが、ザッカーバーグ氏はスタスケバー氏を自宅の夕食に招待し、SSIの買収を提案したが、拒否された後、SSIのCEOを引き抜き、同僚がこのように逃げたことを知ったスタスケバー氏は「非常にショックを受けた」。
- ウィンドサーフの話に戻ると、OpenAIの最大投資家の反対でOpenAIとの取引は失敗に終わり、CEOがGoogleに入社するために会社を去った後、暫定CEOはAIプログラミング会社でもあるCognition(Davinの開発者)から「Chat?」というタイトルのメールを受け取った。
- ウィンドサーフが買収を確定するまでに週末がかかり、臨時CEOが従業員に全員が取引の恩恵を受けると話し、今回はついに待望の拍手が鳴り響いた。
35.04K
もし法案がこの種の指数関数的な成長を達成できるなら(私はGDPが倍増するのを見てきました)、経済学は実際には存在せず、法案自体は公開されており、すべての国がコピーをコピーして持ち帰るでしょう。 MAGAは、マスクが異議を唱えているが、個人的にコミュニケーションをとることを選択しず、親戚や憎しみと公の喧嘩をしなければならないと不平を言っています感情的知性が低い、彼は本当にこれらのJBの卵を信じるふりをするように自分自身を説得することができないと思います、彼はどのように彼は真剣におとぎ話を話すことができますか?

花岗岩³7月2日 07:32
贝森特:我钦佩埃隆在火箭领域的领导力。我会负责财务。
基尔梅德:他说这会增加5万亿美元的赤字——你不同意吗?
贝森特:我完全不同意。这项法案将引发前所未有的增长……一旦你看到增长轨迹转为上升趋势,这项法案的收益将远远超过其成本,我们甚至可能实现财政盈余。
36.64K
ちなみに、Metaが狂ったようにお金を使い、AI研究者の輪の中で人々を密猟した結果、非常に微妙な構造変化もあります。
MetaのチーフAIサイエンティストであり、チューリング三頭政治の1人であり、畳み込みニューラルネットワークの生みの親である64歳のDa Niu氏(64歳)は、実はMetaの新たに任命されたAIリーダー、MITを中退した28歳のAlexandr Wang氏の直属で、以前はデータアノテーションに取り組んでいました。
大きな波が襲った瞬間、資格、年功序列、名誉はすべて脇に置かれました。
冷静沈着な老人であるヤン・ルクンに対しては、アカデミックな地位に留まるべきだったと感じ、「気遣う」という気持ちを多くの人が押し付けています。それは、上司が誰であろうと関係ありません。
また、ヤン・ルカンが1年以内に辞任するという憶測もありますが、それは心の理由に加えて、ヤン・ルカン自身がこの大型モデルの開発方向について実際に否定的であったという事実にも関連しており、彼がメタのギャンブルアーキテクチャが間違っていると固く信じているなら、働くのはさらに不快になります。


57.49K
多くのメディアが大学入試の数学の問題を行うために大きなモデルを使用した最後の時間に続いて、今年の大学入試の実際のテスト結果も出てきましたが、今回はそれを評価しているのはバイトシードチームであり、彼らがビーンバッグの最後の大学入試の数学の結果に驚きと驚きに満ちていることは明らかです、そして彼らはまた、それが全体の科目テスト問題でどのように機能するかを見るために準備を進めています。
原則として、このコンペティションに参加する5つの大型モデル(Gemini 2.5Pro、DeepSeek R1、Claude 4、OpenAI o3、Seed1.6-Thinking)は、さまざまなランニングスコアの点で市場のトッププレーヤーの1つです。
大学入試は、実際には非常に典型的なテストシナリオであり、大規模モデルの一般化能力をテストする目的を達成できるだけでなく、高い実用性を持ち、同様の使用シナリオを想像することは難しくありません。
公平性を確保するために、評価方法が大学入試の紙の方法と完全に一致しているだけでなく、共同入試では上級経験を持つ2人の高校教師によって自由問題が評価され、大規模なモデルはプロンプトワードエンジニアリングを導入しておらず、すべての入力は大学入試の元の問題です。
簡単に言えば、これは実際の候補者が論文を作る環境とほとんど変わりません。
まず結論についてお話ししましょう、大規模モデルの全体的な能力はかなり高いスコアを得ることができました、その中で芸術と科学で1位にランクされているDoubaoとGeminiは、それぞれリベラルアーツで683と科学で655のスコアを獲得しています-このスコアはQingbeiにも影響を与えることができます-評価結果でいくつかの重要な情報を傍受して見ることができます。
- 当然のことながら、大規模モデルで最高のパフォーマンスを発揮した被験者は英語であり、いくつかの評価のスコアは非常に接近していたため、ギャップを埋めるのが困難でした。
- 最もスコアの低い科目は化学と生物学ですが、これはテスト問題自体に関連しています、これら2つの科目には、この一連のテスト問題が公式にリリースされていないため、多くの画像読み取り問題が含まれています。したがって、一部の画像はより曖昧であり、大規模なモデルの点数の損失を直接引き起こします。
- Doubaoは、中国語、英語、物理、地理、歴史、政治の6つの科目で最高得点を獲得し、中国語の科目では地理、歴史、政治の優位性が明らかでした。
- ビーンバッグとは対照的に、ジェミニの科学パフォーマンスは非常に強力で、不明な数値の場合でも、化学と生物学は依然として最高スコアを獲得し、そのルートとビーンバッグの違いは観察するのに非常に価値があります。
- 前回の大学入試の数学評価の結果とは若干の違いがあり、今回は数学科目のトップがDeepSeekですが、他の大きなモデルに遅れをとって非常に小さいです。
- GPT o3は再び動作し始めました,前回は数学の客観的問題でポイントを失った唯一の大規模モデルでした,その結果、今回は中国語の作文がトピックから直接書き出されました,これにより、o3言語のスコアがすべての大規模モデル言語と数学英語のメイン科目15の結果になりました,100を超えなかった唯一のもの...
- 化学と生物学で画像を読む問題を発見した後、テストチームはテストペーパーの高解像度バージョンを見つけ、画像とテキストを織り交ぜる方法で2つの被験者をやり直し、このようにして2つの被験者の合計スコアを約30ポイント向上させることができることを発見しました。
- 現在、大規模モデルのビジュアルソリューションは急速に進んでいるようですが、結局のところ、ビジュアルトークンの消費量は通常のタスクよりもはるかに高いため、現時点で解決する必要がある主な問題は、どのようにコストを削減するかです。
- 大学入試の実際の問題に加えて、テストチームは別のインド工科大学JEEアドバンスド試験評価も実施し、問題はすべて写真で入力され、合計スコアはまだジェミニとドゥバオをリードしており、2つのモデルの結果でさえすでにインドのトップ10に入ることができます。
たとえば、AI業界で有名なHLEベンチマークが最初に登場した今年の初めには、主要な主流モデルのスコアは一般的に10%未満でしたが、HLE開発チームは、過去のルールによれば、この数値は今年末までに50%になる可能性があるとも述べています。
これがどういうことかというと、人間がどれだけ頭を悩ませてAIに問題をやらせても、それは時間の問題ですが、だからといって結果が無意味なわけではなく、重要なのは継続的な学習のプロセスであり、AIを人間がどこまで使えるかを探るために必要なステップでもあるということです。
来年の大学入試が、AIがどんなビジョンをくれるのか、すでに楽しみです。
35.96K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable