DApp Store | Web3 Hub for hendelser og spill

Populære emner

o3 Pro på ARC-AGI Semi Private Eval-resultater ARC-AGI-1: * Lav: 44%, $ 1.64 / oppgave * Middels: 57%, $ 3.18 / oppgave * Høy: 59%, $ 4.16 / oppgave ARC-AGI-2: * All resonnementinnsats: <5%, $ 4-7 / oppgave Takeaways: * O3-Pro i tråd med O3-ytelse * o3s nye pris setter ARC-AGI-1 Frontier

For å merke seg, er o3 Pro *ikke* den samme modellen vi testet i desember '24 (o3-forhåndsvisning) OpenAI har eksplisitt bekreftet dette. Se referanse tweet for mer informasjon

O3-resultatene er oppdatert for å gjenspeile prisreduksjonen på 80 %

Nytt i diagrammet er datapunkter for o3 (Høyt resonnement) og o4-mini (Høyt resonnement). De ble tidligere ekskludert på grunn av modelltidsavbrudd. OpenAIs nye "bakgrunnsmodus" har gjort det mulig for oss å behandle disse modellene på høye datainnstillinger.

Se ledertavlen: Gjengi resultater:

108,76K

Topp

Rangering

Favoritter

Trendende onchain

Trendende på X

Nylig toppfinansiering

Mest lagt merke til