detta underskattar kraftigt prestandahoppen mellan GPT-4 och Opus 4.5, och hur dessa prestandahopp "löste" problem som skulle förvärras i allt från CoT till funktionsanrop