Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nikt nie wie, co nadchodzi
Jedna osoba z pomysłem mogłaby działać jako "CEO" firmy z 10 000 agentami w ciągu 2 lat.
Będziesz miał „oprogramowanie jako myśl”, a nie jako usługę. Kiedy mówisz, miliard instancji „roju” buduje backend, frontend, bezpieczeństwo i infrastrukturę skalowania w ciągu minut.
Ostatnie 18 miesięcy to najszybsze tempo postępu, jakie kiedykolwiek widzieliśmy w historii informatyki.
Zachęcam cię do przeczytania o SWE pro. Zostało stworzone, aby być odporne na zanieczyszczenia. Jeszcze nie przeczytałem dobrego powodu, dlaczego gdy osiągniemy 90-100% w tym benchmarku, całe inżynieria oprogramowania nie byłaby rozwiązana. To jeden z najbardziej złożonych i trudnych do zaprojektowania benchmarków. Zadania są tak długie, że agent musi być w stanie uczyć się na podstawie własnych nieudanych testów w tej samej sesji - w zasadzie model musiałby mieć jakąś formę ciągłego uczenia się, aby pokonać ten benchmark.
Gemini 2.5 uzyskało wynik 13%
Gemini 3 uzyskało wynik 43%
Claude Opus 4.5 obecnie prowadzi z wynikiem 45% (według scale ai) — MACIE LUDZI W ANTHROPIC, KTÓRZY MÓWIĄ, ŻE OBSERWUJĄ CLAUDE'A CAŁY DZIEŃ I ZAPEŁNIAJĄ LUKI.
Oczywiście możecie krzyczeć, że są zmotywowani, aby to powiedzieć, ale czy wasza oś czasu X przez ostatnie 2 tygodnie nie była ciągłym szokiem, jak dobre są modele w kodowaniu? Szczególnie 4.5 Opus?
Jest dla mnie oczywiste, że inżynieria oprogramowania zostanie rozwiązana w ciągu 2 lat. Nawet jeśli podwoisz, a nawet potroisz tę prognozę, miałoby to GŁĘBOKI wpływ na PKB i przeciętne życie Amerykanina.

Najlepsze
Ranking
Ulubione
