DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Anche dopo il notevole progresso degli ultimi 3 mesi, rimane il fatto che le prestazioni dell'AI sono legate alla familiarità con il compito. Nei domini che possono essere campionati densamente (tramite generazione e verifica programmatica), le prestazioni sono effettivamente illimitate e continueranno a crescere dai livelli attuali. Nei domini nuovi e sconosciuti, le prestazioni rimangono basse e ulteriori progressi richiedono ancora nuove idee, non solo più dati e potenza di calcolo.

Per i benchmark che mirano a compiti nuovi, una forma comune di hacking dei benchmark che sfrutta questo divario è generare un campionamento denso di potenziali compiti parametrizzando manualmente lo spazio e poi forzandolo. Molto costoso, ma funziona. C'è poco che puoi fare per ripristinare la validità del benchmark qui, a parte aumentare la dimensionalità dello spazio dei compiti.

22

Principali

Ranking

Preferiti