Questo diventa prezioso quando la rete può ragionare sui propri tracciati di esecuzione e trattarli come un dispositivo di simulazione, quindi affinare un LoRA sulla conoscenza acquisita (o distillarla in qualche forma) come forma di apprendimento continuo. Altre persone nei commenti giustamente sottolineano gli aspetti negativi di questo metodo, ma penso che sia comunque una demo interessante.