- Generalizace je jen algoritmus. - (Zpětná vazba) Transformery se mohou naučit jakýkoli algoritmus pomocí GD. Hlavní otázka: O jakých trénovacích datech? Můj názor: Při tréninku transformerů s RL na správně vybraných problémech se objeví a výrazně zlepší schopnosti generalizace.