Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
I dag kunngjør vi Kosmos, vår nyeste AI-forsker, som er tilgjengelig for bruk nå.
Brukere anslår at Kosmos gjør 6 måneders arbeid på en enkelt dag. En kjøring kan lese 1,500 artikler og skrive 42,000 linjer med kode. Minst 79 % av funnene er reproduserbare. Kosmos har gjort 7 funn så langt, som vi slipper i dag, innen områder som spenner fra nevrovitenskap til materialvitenskap og klinisk genetikk, i samarbeid med våre akademiske betatestere. Tre av disse funnene gjenga upubliserte funn; Fire er netto nye, validerte bidrag til den vitenskapelige litteraturen. AI-akselerert vitenskap er her.
Vår kjerneinnovasjon i Kosmos er bruken av en strukturert, kontinuerlig oppdatert verdensmodell. Som beskrevet i vår tekniske rapport, lar Kosmos' verdensmodell den behandle størrelsesordener mer informasjon enn det som kan passe inn i konteksten til selv de lengste kontekstspråkmodellene, slik at den kan syntetisere mer informasjon og forfølge sammenhengende mål over lengre tidshorisonter enn Robin eller noen av våre andre tidligere agenter. I denne forbindelse mener vi at Kosmos er den mest dataintensive språkagenten som er utgitt så langt på noe felt, og den desidert mest dyktige AI-forskeren som er tilgjengelig i dag. Bruken av en vedvarende verdensmodell gjør det også mulig for enkelt Kosmos-baner å produsere svært komplekse utganger som krever flere betydelige logiske sprang. Som med alle våre systemer, er Kosmos designet med åpenhet og verifiserbarhet i tankene: hver konklusjon i en Kosmos-rapport kan spores gjennom plattformen vår til de spesifikke kodelinjene eller de spesifikke passasjene i den vitenskapelige litteraturen som inspirerte den, noe som sikrer at Kosmos' funn er fullt reviderbare til enhver tid.
Vi bruker også denne anledningen til å kunngjøre lanseringen av Edison Scientific, en ny kommersiell spinout av FutureHouse, som vil være fokusert på å kommersialisere våre agenter og bruke dem til å automatisere vitenskapelig forskning innen legemiddeloppdagelse og utover. Edison vil ta over administrasjonen av FutureHouse-plattformen, hvor du kan få tilgang til Kosmos sammen med våre litteratur-, molekyl- og presedensagenter (tidligere Crow, Phoenix og Owl). Edison vil fortsette å tilby gratis nivåbruk for tilfeldige brukere og akademikere, samtidig som de tilbyr høyere prisgrenser og tilleggsfunksjoner for brukere som trenger dem. Du kan lese mer om denne spinouten på bloggen vår nedenfor.
Noen viktige merknader hvis du skal prøve Kosmos. For det første er Kosmos forskjellig fra mange andre AI-verktøy du kanskje har spilt med, inkludert våre andre agenter. Det ligner mer på et Deep Research-verktøy enn det er på en chatbot: det tar litt tid å finne ut hvordan man ber det effektivt, og vi har prøvd å inkludere retningslinjer om dette for å hjelpe (se nedenfor). Det koster $200/løp akkurat nå (200 studiepoeng per kjøring og $1/kreditt), med noe gratis bruk for akademikere. Dette er sterkt diskontert; folk som registrerer seg for Founding Subscriptions nå kan låse inn prisen på $1/kreditt på ubestemt tid, men prisen vil til slutt sannsynligvis være høyere. Igjen, dette er mindre chatbot og mer forskningsverktøy, noe du kjører på mål av høy verdi etter behov.
Noen forbehold er også berettiget. For det første finner vi at 80 % av Kosmos-funnene er reproduserbare, noe som også betyr at 20 % ikke er det - noen ting den sier vil være feil. Dessuten produserer Kosmos absolutt resultater som tilsvarer flere måneders menneskelig arbeid, men det går også ofte ned i kaninhull eller jager statistisk signifikante, men vitenskapelig irrelevante funn. Vi kjører ofte Kosmos flere ganger på samme mål for å prøve de ulike forskningsveiene det kan ta. Det er fortsatt en haug med grove kanter på brukergrensesnittet og slikt, som vi jobber med. Til slutt er vi klar over at tallet på 6 måneder er mye større enn estimater fra andre AI-laboratorier, som METR, om lengden på oppgaver som AI-agenter for øyeblikket kan utføre. Du kan lese diskusjon om dette i blogginnlegget vårt.
Stor gratulasjon til teamet vårt som satte dette sammen, ledet av @ludomitch og @michaelathinks: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Et spesielt rop til @m_skarlinski og teamet hans som gjenoppbygde plattformen for denne lanseringen, spesielt Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 og flere.
Dette arbeidet ville ikke vært mulig uten betydelige bidrag fra akademiske samarbeidspartnere @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani og @RandallBateman3.
Vi vil også takke våre mange støttespillere, spesielt @ericschmidt, som har vært en enorm alliert. Vi vil ha mer å si om våre støttespillere snart!
Topp
Rangering
Favoritter

