Do prdele... Meta možná právě vyřešila samozdokonalující se umělou inteligenci 🤯 Jejich nový článek SPICE (Self-Play in Corpus Environments) v podstatě mění jazykový model na vlastního učitele, žádné lidi, žádné štítky, žádné datové sady, pouze internet jako jeho tréninkové hřiště. Zde je zvrat: z jedné kopie modelu se stane vyzyvatel, který se prohrabává skutečnými dokumenty a vytváří tvrdé, fakty podložené problémy s uvažováním. Další kopií se stává Reasoner, který se je snaží vyřešit bez přístupu ke zdroji. Soutěží, učí se a vyvíjejí společně automatické učební osnovy s reálným světem, aby se nikdy nezhroutily do halucinací. Výsledky jsou ořechové: +9,1 % v referenčních hodnotách s Qwen3-4B +11,9 % s OctoThinker-8B a poráží všechny předchozí metody self-play, jako je R-Zero a Absolute Zero. To obrací scénář k sebezdokonalování umělé inteligence. Namísto smyčky na syntetickém odpadu SPICE roste těžbou skutečných znalostí v systému uzavřené smyčky s inteligencí otevřeného světa. Pokud se to rozšíří, možná budeme zírat na plán autonomních, sebevyvíjejících se modelů uvažování.