Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ensimmäinen laajamittainen tutkimus tekoälyagenteista, jotka todella toimivat tuotannossa.
Hypetys sanoo, että agentit muuttavat kaiken. Data kertoo toisen tarinan.
Tutkijat haastattelivat 306 ammattilaista ja toteuttivat 20 syvällistä tapaustutkimusta 26 eri alalla. Heidän löytönsä haastaa yleiset oletukset siitä, miten tuotantoagentit rakennetaan.
Todellisuus: tuotantoagentit ovat tarkoituksella yksinkertaisia ja tiukasti rajoitettuja.
1) Kaavat ja luotettavuus
- 68 % suorittaa enintään 10 vaihetta ennen ihmisen puuttumista.
- 47 % suorittaa alle 5 askelta.
- 70 % luottaa valmiiden mallien kehottamiseen ilman hienosäätöä.
- 74 % perustuu ensisijaisesti ihmisen arviointiin.
Tiimit vaihtavat tarkoituksella autonomian luotettavuuteen.
Miksi rajoitukset? Luotettavuus on edelleen ratkaisematon haaste. Ammattilaiset eivät voi vahvistaa agentin oikeellisuutta laajassa mittakaavassa. Julkiset benchmarkit eivät yleensä sovellu alakohtaisiin tuotantotehtäviin. 75 % haastatelluista tiimeistä arvioi ilman virallisia vertailuarvoja, luottaen sen sijaan A/B-testaukseen ja suoraan käyttäjäpalautteeseen.
2) Mallin valinta
Mallin valintamalli yllätti tutkijat. 17/20 tapaustutkimusta käyttää suljetun lähdekoodin rajamalleja, kuten Claude Sonnet 4, Claude Opus 4.1 ja GPT o3. Avoimen lähdekoodin käyttöönotto on harvinaista ja sitä ohjaavat erityiset rajoitteet: suuret työmäärät, joissa päättelykustannukset kasvavat liian korkeiksi, tai sääntelyvaatimukset, jotka estävät tiedon jakamisen ulkoisten toimittajien kanssa. Useimmille tiimeille suoritusaikakustannukset ovat mitättömiä verrattuna agentin täydentämiin ihmisasiantuntijoihin.
3) Agenttikehykset
Kehyksen käyttöönotto osoittaa silmiinpistävän poikkeaman. 61 % kyselyyn vastanneista käyttää kolmannen osapuolen kehyksiä, kuten LangChain/LangGraphia. Mutta 85 % haastatelluista tuotantokäyttöönoton tiimeistä rakentaa räätälöityjä toteutuksia alusta alkaen. Syynä on se, että ydinagenttisilmukat on helppo toteuttaa suorilla API-kutsuilla. Tiimit suosivat minimalistisia, tarkoitukseen rakennettuja tukirakenteita riippuvuuspaisutuksen ja abstraktiokerrosten sijaan.
4) Agentin ohjausvirta
Tuotantoarkkitehtuurit suosivat ennalta määriteltyjä staattisia työnkulkuja avoimen autonomian sijaan. 80 % tapaustutkimuksista käyttää rakenteellista ohjausvirtaa. Agentit toimivat hyvin rajattuissa toimintatiloissa sen sijaan, että tutkisivat ympäristöjä vapaasti. Vain yksi tapaus salli rajoittamattoman tutkimisen, ja se järjestelmä toimii yksinomaan hiekkalaatikkoympäristöissä, joissa on tiukka CI/CD-varmennus....

Johtavat
Rankkaus
Suosikit

