DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Ingen vet vad som väntar En enda person med en idé kan agera som "VD" för ett företag med 10 000 agenter om två år Du kommer att ha "mjukvara som en tanke" och inte som en tjänst. När du talar bygger en miljard instanser bygger "swarm" backend, frontend, säkerhet och skalningsinfrastruktur på några minuter. De senaste 18 månaderna har sett den snabbaste takten vi någonsin sett i datavetenskapens historia. Jag uppmanar dig att läsa om SWE Pro. Den var gjord för att vara kontamineringsresistent. Jag har ännu inte läst någon bra anledning till varför när vi väl får 90-100 % på detta benchmark så skulle all mjukvaruutveckling inte vara löst. Detta är en av de mest komplexa och svårdesignade benchmarkarna. Uppgifterna är så långa att agenten måste kunna lära sig av sina egna misslyckade testkörningar inom samma session – i princip skulle en modell behöva ha någon form av kontinuerligt lärande för att slå denna referenspunkt. Gemini 2.5 förhandsvisning fick 13 % Gemini 3 förhandsvisning fick 43 % i betyg Claude Opus 4.5 leder för närvarande med 45 % (enligt scale ai) — DU HAR FOLK PÅ ANTHROPIC SOM SÄGER ATT DE TITTAR PÅ CLAUDE HELA DAGEN OCH FYLLER I LUCKOR. Visst kan du ropa varg över att de är motiverade att säga det, men har din X-tidslinje inte de senaste två veckorna varit en ständig chock över hur bra modellerna på kodning är? Speciellt 4.5 Opus? Det är helt klart för mig att mjukvaruutveckling kommer att vara löst på två år. Även om du skulle dubbla, nej, TRIPPLA den gissningen skulle ha en DJUPGÅENDE påverkan på BNP och genomsnittligt amerikanskt liv

Topp

Rankning

Favoriter