Oikean elämän päättely perustuu usein varmennustyökaluihin — erinomaisia matematiikassa, mutta hankalaa luovassa kirjoittamisessa tai avoimessa tutkimuksessa. Tässä on RARO: uusi paradigma, joka opettaa LLM:iä järkeilemään vastakkainasettelupelien kautta varmennuksen sijaan. Ei varmentajia. Ei ympäristöjä. Vain demonstraatioita. 🧵👇