DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Jakub Pachocki

OpenAI

Afgelopen week namen onze redeneermodellen deel aan de 2025 International Collegiate Programming Contest (ICPC), de belangrijkste programmeerwedstrijd op universitair niveau ter wereld. Ons systeem loste alle 12 van de 12 problemen op, een prestatie die wereldwijd de eerste plaats zou hebben opgeleverd (het beste menselijke team loste 11 problemen op). Deze mijlpaal sluit een intense periode van 2 maanden van competitieprestaties door onze modellen af: - Een tweede plaats in de AtCoder Heuristics World Finals - Gouden medaille op de Internationale Wiskunde Olympiade - Gouden medaille op de Internationale Olympiade in Informatica - En nu, een gouden medaille, eerste plaats op de ICPC World Finals. Ik geloof dat deze resultaten, voortkomend uit een familie van algemene redeneermodellen die zijn geworteld in ons belangrijkste onderzoeksprogramma, misschien wel de duidelijkste maatstaf voor vooruitgang dit jaar zijn. Deze competities zijn geweldige zelf-contained, tijdgebonden tests voor het vermogen om nieuwe ideeën te ontdekken. Zelfs voordat onze modellen bedreven waren in eenvoudige rekenkunde, keken we naar deze wedstrijden als mijlpalen van vooruitgang richting transformerende kunstmatige intelligentie. Onze modellen behoren nu tot de top van de mensen in deze domeinen, wanneer ze worden geconfronteerd met goed gedefinieerde vragen en beperkt zijn tot ~5 uur. De uitdaging nu is om over te stappen naar meer open-eindige problemen en veel langere tijdshorizonten. Dit niveau van redeneervermogen, toegepast over maanden en jaren op problemen die er echt toe doen, is wat we nastreven - het automatiseren van wetenschappelijke ontdekking. Deze snelle vooruitgang benadrukt ook het belang van veiligheid en afstemming onderzoek. We hebben nog meer begrip nodig van de afstemmings eigenschappen van langlopende redeneermodellen; in het bijzonder raad ik aan om de fascinerende bevindingen te bekijken van de studie naar samenzwering in redeneermodellen die we vandaag hebben vrijgegeven. Gefeliciteerd aan mijn teamgenoten die hun hart hebben gestoken in het behalen van deze competitie resultaten, en aan iedereen die bijdraagt aan het onderliggende fundamentele onderzoek dat hen mogelijk maakt!

Boven

Positie

Favorieten