Wir benötigen neue Benchmarks für Lösungen mit geringer Komplexität zur Lösung von Programmierproblemen. Jede neue Funktion ist wie ein Jenga-Block in einem Turm, und die aktuellen Benchmarks bewerten nur, wie gut jeder Block zusammengesetzt ist. Wir benötigen Bewertungen, die verfolgen, wie hoch Sie die Blöcke stapeln können, bevor der Turm zusammenbricht.