トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
過去3か月の急激な進歩にもかかわらず、AIのパフォーマンスはタスクの慣れ度に結びついています。プログラム生成+検証によって高密度サンプリング可能な領域では、性能は実質的に無限となり、現在のレベルから増加し続けます。新しく馴染みのない分野では、パフォーマンスは低く、さらなる進歩には新しいアイデアが必要であり、単にデータや計算を増やすだけではありません。

13時間前
さて、AIに24時間ずっと作業させ続ける実験はここで終わりだと思います。うまくいきません。コードは爆発的に複雑になり、結果はあまり良くなく、AIはハードウォールを突破できず(SupGenすら完全に理解できず)、そして非常に高価です(過去2日間で約1,000ドルかかりました)。最も良い結果はJSコンパイラで、主にinetsと比べて馴染みやすいためですが、コードベースのコントロールを失う価値はありません。
AIが背景で働き、重要なこと(つまり本当に新しいこと)で実際に進展を遂げるという夢はまだ実現していないと思います。それでもなお、自分の訓練データに固執し、型にはまった発想ができない機械です。すでに建てられたものを建てるのに最適です。でも新しいものではありません
また、コーディングにはあまり評価されていない利点があります。それは、コードベースを構築して学ぶという二つのことを同時に行うということです。AIはその半分しかできません。もう半分は明らかに不可能です 🤔
新規課題を対象としたベンチマークでは、このギャップをアービトラージする一般的なベンチマークハッキングの形態として、空間を手動でパラメータ化して潜在的なタスクの密集サンプリングを作成し、ブルートフォースで処理する方法があります。とても高価ですが、機能しています。ここでベンチマークの妥当性を回復するためにできることは、タスク空間の次元性を高めること以外にほとんどありません。
29
トップ
ランキング
お気に入り
