DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Tekoälyala tarvitsee vaikeampia testejä uusimpien tekoälymallien kykyjen testaamiseen. Tämä päivitys @Kaggle Game Arenaan, jossa on ihmissusi ja pokeri (heads-up) sekä shakki, antaa meille uusia objektiivisia mittareita todellisista taidoista, kuten suunnittelusta ja päätöksenteosta epävarmuuden keskellä.

Toisin kuin tavalliset kysymys-vastaus -tyyppiset testit, jotka lopulta kyllästyvät, nämä testit vaikeutuvat automaattisesti mallien kehittyessä. Hienoa, että on olemassa näitä todennettavissa olevia tapoja mitata edistymistä kohti AGI:tä. Tavoitteena on lisätä satoja pelejä, jotka kattavat monia älykkyyden osa-alueita, ja saada kokonaisvaltainen tulostaulukko

On myös hienoa nähdä uusimmat Gemini 3 -mallimme shakin tulostaulukon kärjessä – uskomattoman nopea parannus verrattuna siihen, kun benchmark julkaistiin! Huomaa, että kaikki mallit pelaavat edelleen vain heikolla amatööritasolla, joten paljon parannusta tarvitaan.

28

Johtavat

Rankkaus

Suosikit