Niemand weiß, was kommt Eine einzelne Person mit einer Idee könnte in 2 Jahren als "CEO" eines Unternehmens mit 10.000 Agenten agieren. Du wirst „Software als Gedanken“ haben, nicht als Dienstleistung. Wenn du sprichst, baut ein milliardenschweres "Schwarm" in Minuten das Backend, Frontend, die Sicherheit und die Skalierungsinfrastruktur auf. Die letzten 18 Monate haben das schnellste Fortschrittsniveau gezeigt, das wir je in der Geschichte der Informatik erlebt haben. Ich bitte dich, über SWE pro zu lesen. Es wurde entwickelt, um kontaminationsresistent zu sein. Ich habe noch keinen guten Grund gelesen, warum, sobald wir 90-100% bei diesem Benchmark erreichen, nicht die gesamte Softwaretechnik gelöst wäre. Dies ist einer der komplexesten und schwierigsten entworfenen Benchmarks. Die Aufgaben sind so lang, dass der Agent in der Lage sein muss, aus seinen eigenen fehlgeschlagenen Testläufen innerhalb derselben Sitzung zu lernen - im Wesentlichen müsste ein Modell eine Form des kontinuierlichen Lernens haben, um diesen Benchmark zu übertreffen. Gemini 2.5 Vorschau erzielte 13% Gemini 3 Vorschau erzielte 43% Claude Opus 4.5 liegt derzeit mit 45% (laut scale ai) in Führung — DU HAST LEUTE BEI ANTHROPIC, DIE DIR SAGEN, DASS SIE CLAUDE DEN GANZEN TAG ÜBER BEOBACHTEN UND LÜCKEN AUSFÜLLEN. Sicher, du kannst den Wolf schreien, dass sie Anreize haben, das zu sagen, aber war deine X-Zeitleiste in den letzten 2 Wochen nicht ständig schockiert darüber, wie gut die Modelle im Programmieren sind? Besonders 4.5 Opus? Es ist mir absolut klar, dass die Softwaretechnik in 2 Jahren gelöst sein wird. Selbst wenn du diese Schätzung verdoppeln, nein, verdreifachen würdest, hätte das einen tiefgreifenden Einfluss auf das BIP und das durchschnittliche Leben der Amerikaner.