DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Vaikka viimeisten kolmen kuukauden aikana on edistynyt jyrkästi, tekoälyn suorituskyky on edelleen sidottu tehtävien tuttuuteen. Alueilla, joita voidaan tiiviisti näytteisttää (ohjelmallisen generoinnin + verifioinnin avulla), suorituskyky on käytännössä rajoittamaton ja kasvaa jatkuvasti nykyisistä tasoista. Uusilla, tuntemattomilla aloilla suorituskyky pysyy matalana ja edistyminen vaatii edelleen uusia ideoita, ei vain lisää dataa ja laskentaa.

Benchmarkeissa, jotka kohdistuvat uusiin tehtäviin, yleinen benchmark-hakkeroinnin muoto, joka arbitraasoi tätä aukkoa, on tuottaa tiheä otos mahdollisista tehtävistä parametrisoimalla tilan manuaalisesti ja sitten brute-forc-menetelmällä. Erittäin kallista, mutta toimii. Tässä ei juuri voi tehdä vertailuarvon pätevyyden palauttamiseksi, paitsi lisätä tehtävätilan ulottuvuutta.

28

Johtavat

Rankkaus

Suosikit