Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Robert Youssef
Tämä tekoälykehotus ajattelee kuin mies, joka hallinnoi 124 miljardia dollaria.
Se on Ray Dalion "Principles"-päätöksentekojärjestelmä, joka on muuttunut jättimäiseksi kehotteemaksi.
Käytin sitä arvioidakseni 15 startup-ideaa. Tappoi 13. Kaksi selviytyjää muodostuivat parhaaksi työkseni.
Tässä on kehote, jonka voit varastaa ↓

Voi helvetti... tämä MIT:n artikkeli selittää hiljaa, miten mallit voivat opettaa itsensä järkeilemään, kun ne ovat täysin jumissa 🤯
Ydinajatus on petollisen yksinkertainen:
Päättely epäonnistuu, koska oppimisessa ei ole mitään, mihin tarttua.
Kun mallin onnistumisprosentti laskee lähes nollaan, vahvistusoppiminen lakkaa toimimasta. Ei palkintomerkkiä. Ei liukuväriä. Ei parannusta. Malli ei ole "huono päättelyssä" — se on jumissa opittavuuden rajojen ulkopuolella.
Tämä artikkeli muotoilee ongelman uudelleen.
Sen sijaan, että kysyttäisiin "Miten malli ratkaisee vaikeampia ongelmia?"
He kysyvät: "Miten malli luo ongelmia, joista se voi oppia?"
Tässä SOAR astuu kuvaan.
SOAR jakaa yhden esikoulutetun mallin kahteen rooliin:
• Opiskelija, joka yrittää kohdistaa erittäin vaikeita kohdistettuja ongelmia
• Opettaja, joka luo oppilaalle uusia koulutusongelmia
Mutta rajoitus on julma.
Opettajaa ei koskaan palkita älykkäistä kysymyksistä, monimuotoisuudesta tai realismista.
Se palkitaan vain, jos opiskelijan suoritus paranee kiinteässä joukossa todellisia arviointiongelmia.
Ei parannusta? Ei palkintoa.
Tämä muuttaa dynamiikkaa täysin.
Opettaja ei optimoi estetiikan tai uutuuden vuoksi.
Se optimoi oppimisen edistymisen kannalta.
Ajan myötä opettaja huomaa jotain, mitä ihmiset yleensä koodaavat käsin:
Välivaiheen ongelmia.
Ei ratkaistuja versioita kohdetehtävästä.
Ei laimeamia kopioita.
Mutta ongelmat, jotka sijaitsevat juuri opiskelijan nykyisten kykyjen rajojen sisällä — tarpeeksi lähellä oppiakseen, tarpeeksi kaukana ollakseen merkityksellisiä.
Tässä tulee yllättävä osa.
Nämä syntyneet ongelmat eivät tarvitse oikeita vastauksia.
Niitä ei edes tarvitse ratkaista opettajan toimesta.
Tärkeintä on rakenne.
Jos kysymys pakottaa opiskelijan päättelemään oikeaan suuntaan, gradienttisignaali syntyy ilman täydellistä valvontaa. Oppiminen tapahtuu kamppailun kautta, ei jäljittelyn kautta.
Siksi SOAR toimii siellä, missä suora RL epäonnistuu.
Sen sijaan, että hän törmäisi palkintokallioon, opiskelija kiipeää portaat, joita se auttoi rakentamaan.
Kokeet tekevät tämän tuskallisen selväksi.
Benchmarkeissa, joissa mallit alkavat absoluuttisesta nollasta — kirjaimellisesti 0 onnistumista — standardimenetelmät pysyvät tasaisesti. SOARin myötä suorituskyky alkaa nousta tasaisesti, kun opetussuunnitelma muokkaa itseään mallin sisäisen tiedon ympärille.
Tämä on hiljainen mutta radikaali muutos.
Ajattelemme yleensä, että päättelyä rajoittaa mallin koko, datamittakaava tai koulutuslaskenta.
Tämä artikkeli viittaa täysin toiseen pullonkaulaan:
Huonot oppimisympäristöt.
Jos mallit pystyvät luomaan omat ponnahduslautansa, monet "päättelyrajat" lakkaavat olemasta rajoituksia lainkaan.
Ei uutta arkkitehtuuria.
Ei ylimääräisiä ihmisleimoja.
Ei isompia malleja.
Vain parempia kannustimia oppimisen etenemiselle.
Epämiellyttävä johtopäätös on tämä:
Järkeilyn tasot eivät ole perustavanlaatuisia.
Ne ovat itse aiheutettuja.
Ja eteenpäin tulevaisuus ei ole mallien pakottaminen ajattelemaan tarkemmin, vaan antaa heidän päättää, mitä oppia seuraavaksi.

16
Grok 4.1 on ainoa tekoäly, jossa on reaaliaikaista web + X -dataa.
Käytän sitä seuraamaan trendaavia aiheita, viraaleja meemejä ja tuoreita uutisia.
Löysin kolme viruksen trendiä kuusi tuntia ennen kuin ne saavuttivat valtavirran.
Tässä on 12 Grok-aihetta, jotka ennustavat, mitä seuraavaksi leviää viraalina:

58
Johtavat
Rankkaus
Suosikit