am testat 500+ modele anul acesta, livrând un produs AI cu +6.000 de utilizatori. Observate: 1. chatul atinge un plafon 2. Războaiele modelelor demontează modelele mai vechi 3. Open Source este mai bun pentru constructori 4. Evaluările ar trebui să măsoare execuția sarcinilor 5. contextul este mai important decât raționamentul îmbunătățit