DApp Store | Web3 Hub for hendelser og spill

Populære emner

Selv etter den bratte fremgangen de siste tre månedene, er det fortsatt slik at AI-ytelse er knyttet til oppgavekjennskap. I domener som kan tettpakkes (via programmatisk generering + verifisering), er ytelsen effektivt ubegrenset, og vil fortsette å øke fra dagens nivåer. I nye, ukjente områder forblir ytelsen lav og videre fremgang krever fortsatt nye ideer, ikke bare mer data og databehandling.

For benchmarks som retter seg mot nye oppgaver, er en vanlig form for benchmark-hacking som arbitrerer dette gapet å generere et tett utvalg av potensielle oppgaver ved manuelt parameterisering av rommet og deretter brute-forcere det. Veldig dyrt, men det fungerer. Det er lite du kan gjøre for å gjenopprette referansegyldigheten her annet enn å øke dimensjonaliteten i oppgaverommet.

35

Topp

Rangering

Favoritter