Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Första storskaliga studien av AI-agenter som faktiskt körs i produktion.
Hypen säger att agenter förändrar allt. Datan berättar en annan historia.
Forskarna undersökte 306 praktiker och genomförde 20 djupgående fallstudier inom 26 områden. Det de fann utmanar vanliga antaganden om hur produktionsagenter byggs.
Verkligheten: produktionsagenter är medvetet enkla och strikt begränsade.
1) Mönster och tillförlitlighet
- 68 % utför högst 10 steg innan mänsklig intervention krävs.
- 47 % klarar färre än 5 steg.
- 70 % förlitar sig på att skicka färdiga modeller utan någon finjustering.
- 74 % beror främst på mänsklig utvärdering.
Lagen byter medvetet autonomi mot pålitlighet.
Varför dessa begränsningar? Tillförlitlighet är fortfarande den största olösta utmaningen. Utövare kan inte verifiera agentens korrekthet i stor skala. Publika riktmärken gäller sällan för domänspecifika produktionsuppgifter. 75 % av de intervjuade teamen utvärderar utan formella riktmärken och förlitar sig istället på A/B-testning och direkt användarfeedback.
2) Modellval
Modellvalsmönstret överraskade forskarna. 17 av 20 fallstudier använder slutna frontmodeller som Claude Sonnet 4, Claude Opus 4.1 och GPT o3. Adoption av öppen källkod är sällsynt och drivs av specifika begränsningar: arbetsbelastningar med hög volym där inferenskostnader blir för höga, eller regulatoriska krav som hindrar datadelning med externa leverantörer. För de flesta team är körtidskostnaderna försumbar jämfört med de mänskliga experter som agenten förstärker.
3) Agentramverk
Ramverksanvändning visar en påtaglig skillnad. 61 % av de som svarade använder tredjepartsramverk som LangChain/LangGraph. Men 85 % av de intervjuade teamen med produktionsimplementeringar bygger anpassade implementationer från grunden. Anledningen: kärnagentloopar är enkla att implementera med direkta API-anrop. Team föredrar minimala, specialbyggda ställningar framför beroende-, uppblåsthet och abstraktionslager.
4) Agentkontrollflöde
Produktionsarkitekturer föredrar fördefinierade statiska arbetsflöden framför öppen autonomi. 80 % av fallstudierna använder strukturerat kontrollflöde. Agenter verkar inom väl avgränsade actionutrymmen snarare än att fritt utforska miljöer. Endast ett fall tillät obegränsad utforskning, och det systemet körs uteslutande i sandlådemiljöer med rigorös CI/CD-verifiering....

Topp
Rankning
Favoriter

