Zusammenfassung: KI-Modelle werden darauf trainiert, bei Benchmarks gut abzuschneiden, nicht unbedingt bei realen Aufgaben. KI ist fast so gut wie Krypto darin geworden, mit Zahlen zu lügen.