Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Do prdele... Meta možná právě vyřešila samozdokonalující se umělou inteligenci 🤯
Jejich nový článek SPICE (Self-Play in Corpus Environments) v podstatě mění jazykový model na vlastního učitele, žádné lidi, žádné štítky, žádné datové sady, pouze internet jako jeho tréninkové hřiště.
Zde je zvrat: z jedné kopie modelu se stane vyzyvatel, který se prohrabává skutečnými dokumenty a vytváří tvrdé, fakty podložené problémy s uvažováním. Další kopií se stává Reasoner, který se je snaží vyřešit bez přístupu ke zdroji.
Soutěží, učí se a vyvíjejí společně automatické učební osnovy s reálným světem, aby se nikdy nezhroutily do halucinací.
Výsledky jsou ořechové:
+9,1 % v referenčních hodnotách s Qwen3-4B
+11,9 % s OctoThinker-8B
a poráží všechny předchozí metody self-play, jako je R-Zero a Absolute Zero.
To obrací scénář k sebezdokonalování umělé inteligence.
Namísto smyčky na syntetickém odpadu SPICE roste těžbou skutečných znalostí v systému uzavřené smyčky s inteligencí otevřeného světa.
Pokud se to rozšíří, možná budeme zírat na plán autonomních, sebevyvíjejících se modelů uvažování.

Top
Hodnocení
Oblíbené

