Å akselerere vitenskapelig fremgang er en av de mest virkningsfulle måtene KI kan gagne samfunnet på. Modeller kan allerede hjelpe forskere med å resonnere gjennom vanskelige problemer — men å gjøre dette godt betyr å teste modeller på tøffere evalueringer og i reelle vitenskapelige arbeidsflyter basert på eksperimenter.
GPT-5.2 er vår sterkeste modell på FrontierScience-evalueringen, og viser klare fremskritt på vanskelige vitenskapelige oppgaver. Men referansepunktet avslører også et gap mellom sterk ytelse på strukturerte problemer og den åpne, iterative resonnementet som ekte forskning krever.
Den mest meningsfulle målestokken for KI i vitenskapen er de nye oppdagelsene den muliggjør. FrontierScience ligger oppstrøms for dette målet, og gir en ledestjerne for vitenskapelig resonnement på ekspertnivå ved å teste modeller på utfordrende, standardiserte problemer og vise hvor de lykkes eller svikter. Selv om det nødvendigvis er smalt, er FrontierScience et steg mot de hardere, mer meningsfulle referansepunktene feltet trenger.
Kloning er et grunnleggende verktøy for molekylærbiologi, og effektivitetsforbedringer har anvendelser i hele bioteknologi. Dette gir et innblikk i hvordan KI kan samarbeide side om side med biologer for å fremskynde forskningen. Forbedring av eksperimentelle metoder vil hjelpe menneskelige forskere til å jobbe raskere, redusere kostnader og omsette funnene til reell effekt.
Å kombinere hardere benchmarks som FrontierScience med virkelige laboratorieevalueringer gir oss et klarere kart over hvor modeller er effektive i dag og hvor videre utvikling trengs. Vi ser sterk tidlig potensial, sammen med veldefinerte begrensninger, og vi vil fortsette å iterere med forskere for å gjøre disse modellene mer kapable og pålitelige partnere i oppdagelse.
115