Nikt nie wie, co nadchodzi Jedna osoba z pomysłem mogłaby działać jako "CEO" firmy z 10 000 agentami w ciągu 2 lat. Będziesz miał „oprogramowanie jako myśl”, a nie jako usługę. Kiedy mówisz, miliard instancji „roju” buduje backend, frontend, bezpieczeństwo i infrastrukturę skalowania w ciągu minut. Ostatnie 18 miesięcy to najszybsze tempo postępu, jakie kiedykolwiek widzieliśmy w historii informatyki. Zachęcam cię do przeczytania o SWE pro. Zostało stworzone, aby być odporne na zanieczyszczenia. Jeszcze nie przeczytałem dobrego powodu, dlaczego gdy osiągniemy 90-100% w tym benchmarku, całe inżynieria oprogramowania nie byłaby rozwiązana. To jeden z najbardziej złożonych i trudnych do zaprojektowania benchmarków. Zadania są tak długie, że agent musi być w stanie uczyć się na podstawie własnych nieudanych testów w tej samej sesji - w zasadzie model musiałby mieć jakąś formę ciągłego uczenia się, aby pokonać ten benchmark. Gemini 2.5 uzyskało wynik 13% Gemini 3 uzyskało wynik 43% Claude Opus 4.5 obecnie prowadzi z wynikiem 45% (według scale ai) — MACIE LUDZI W ANTHROPIC, KTÓRZY MÓWIĄ, ŻE OBSERWUJĄ CLAUDE'A CAŁY DZIEŃ I ZAPEŁNIAJĄ LUKI. Oczywiście możecie krzyczeć, że są zmotywowani, aby to powiedzieć, ale czy wasza oś czasu X przez ostatnie 2 tygodnie nie była ciągłym szokiem, jak dobre są modele w kodowaniu? Szczególnie 4.5 Opus? Jest dla mnie oczywiste, że inżynieria oprogramowania zostanie rozwiązana w ciągu 2 lat. Nawet jeśli podwoisz, a nawet potroisz tę prognozę, miałoby to GŁĘBOKI wpływ na PKB i przeciętne życie Amerykanina.