DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Ensimmäinen laajamittainen tutkimus tekoälyagenteista, jotka todella toimivat tuotannossa. Hypetys sanoo, että agentit muuttavat kaiken. Data kertoo toisen tarinan. Tutkijat haastattelivat 306 ammattilaista ja toteuttivat 20 syvällistä tapaustutkimusta 26 eri alalla. Heidän löytönsä haastaa yleiset oletukset siitä, miten tuotantoagentit rakennetaan. Todellisuus: tuotantoagentit ovat tarkoituksella yksinkertaisia ja tiukasti rajoitettuja. 1) Kaavat ja luotettavuus - 68 % suorittaa enintään 10 vaihetta ennen ihmisen puuttumista. - 47 % suorittaa alle 5 askelta. - 70 % luottaa valmiiden mallien kehottamiseen ilman hienosäätöä. - 74 % perustuu ensisijaisesti ihmisen arviointiin. Tiimit vaihtavat tarkoituksella autonomian luotettavuuteen. Miksi rajoitukset? Luotettavuus on edelleen ratkaisematon haaste. Ammattilaiset eivät voi vahvistaa agentin oikeellisuutta laajassa mittakaavassa. Julkiset benchmarkit eivät yleensä sovellu alakohtaisiin tuotantotehtäviin. 75 % haastatelluista tiimeistä arvioi ilman virallisia vertailuarvoja, luottaen sen sijaan A/B-testaukseen ja suoraan käyttäjäpalautteeseen. 2) Mallin valinta Mallin valintamalli yllätti tutkijat. 17/20 tapaustutkimusta käyttää suljetun lähdekoodin rajamalleja, kuten Claude Sonnet 4, Claude Opus 4.1 ja GPT o3. Avoimen lähdekoodin käyttöönotto on harvinaista ja sitä ohjaavat erityiset rajoitteet: suuret työmäärät, joissa päättelykustannukset kasvavat liian korkeiksi, tai sääntelyvaatimukset, jotka estävät tiedon jakamisen ulkoisten toimittajien kanssa. Useimmille tiimeille suoritusaikakustannukset ovat mitättömiä verrattuna agentin täydentämiin ihmisasiantuntijoihin. 3) Agenttikehykset Kehyksen käyttöönotto osoittaa silmiinpistävän poikkeaman. 61 % kyselyyn vastanneista käyttää kolmannen osapuolen kehyksiä, kuten LangChain/LangGraphia. Mutta 85 % haastatelluista tuotantokäyttöönoton tiimeistä rakentaa räätälöityjä toteutuksia alusta alkaen. Syynä on se, että ydinagenttisilmukat on helppo toteuttaa suorilla API-kutsuilla. Tiimit suosivat minimalistisia, tarkoitukseen rakennettuja tukirakenteita riippuvuuspaisutuksen ja abstraktiokerrosten sijaan. 4) Agentin ohjausvirta Tuotantoarkkitehtuurit suosivat ennalta määriteltyjä staattisia työnkulkuja avoimen autonomian sijaan. 80 % tapaustutkimuksista käyttää rakenteellista ohjausvirtaa. Agentit toimivat hyvin rajattuissa toimintatiloissa sen sijaan, että tutkisivat ympäristöjä vapaasti. Vain yksi tapaus salli rajoittamattoman tutkimisen, ja se järjestelmä toimii yksinomaan hiekkalaatikkoympäristöissä, joissa on tiukka CI/CD-varmennus....

Johtavat

Rankkaus

Suosikit