Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tämä artikkeli paljastaa hiljaisesti, miksi useimmat "tekoälyagentit insinöörityössä" epäonnistuvat heti, kun he lähtevät leludemoista.
Kaikki olettavat, että vaikea osa on kieli. Tai päättelyä. Tai isompia malleja. Tämä työ osoittaa, että todellinen pullonkaula on rakenne.
Artikkelissa esitellään SimuAgent, LLM-pohjainen avustaja Simulinkille, graafiselle mallinnusympäristölle, jota miljoonat insinöörit käyttävät turvallisuuskriittisillä aloilla. Autot. Lentokone. Sähköverkot. Paikkoja, joissa hallusinaatiot eivät saa toista mahdollisuutta.
Ydinongelma on ruma. Simulink ei ole tekstiä. Se on hierarkkisia graafeja, joissa on tiukat topologiasäännöt, alakohtaiset rajoitteet ja tuhannet pätevät mutta hauraat lohkoyhdistelmät. XML:n dumppaaminen LLM:ään ei toimi. Kuvakaappaukset eivät toimi. Pitkät kehotteet romahtavat kontekstirajoitusten alla.
Joten kirjoittajat muuttavat esitystä.
XML:n tai kuvien sijaan SimuAgent muuntaa Simulink-mallit kompaktiksi Python-sanakirjaksi. Vain olennaiset asiat säilyvät: lohkot, parametrit, yhteydet. Ei layout-ääntä. Ei visuaalista sotkua. Tokenien määrä laskee ~43k:sta ~2,7k:een reaalimaisissa esimerkeissä, ja vielä pienemmäksi yksinkertaistamisen jälkeen.
Tämä ei ole kosmeettista. Se muuttaa perustavanlaatuisesti sitä, mitä malli voi pohtia.
Lisäksi agentti käyttää lean-plan–execute-silmukkaa. Ei laajaa moniagenttisirkusta. Suunnittelu tarpeen mukaan. Suoritetaan kun turvallista. Suunnittelu tapahtuu vasta validointivirheiden jälkeen. Paikallinen Python-testisarja havaitsee johdotusvirheet, virheelliset parametrit ja tyyppivirheet ennen kuin MATLAB edes käynnistyy.
Mutta mielenkiintoisin panos ei ole arkkitehtoninen. Näin he kouluttavat mallia.
Pitkän aikavälin työkalujen käytössä on julma palkitsemisongelma. Tiedät vain, onnistuiko malli aivan lopussa. Yksi skalaaripalkinto. Ei ohjausta lennon aikana. GRPO auttaa hieman, mutta sitä on silti vähän.
Heidän ratkaisunsa on Reflection-GRPO.
Kun ensimmäinen käyttöönottoerä epäonnistuu, malli tuottaa lyhyitä heijastusjälkiä, jotka selittäisivät, mikä meni pieleen — väärinkäytettyjä työkaluja, vääriä oletuksia, puuttuvia vaiheita. Nämä pohdinnat ohjataan toiseen alaryhmään, joka ohjaa tutkimusta vuotamatta vastauksia. Alussa reflektiointi on yleistä. Kun malli kehittyy, se luonnollisesti haalistuu.
Oppiminen kiihtyy. Epävakaus vähenee.
He yhdistävät tämän nerokkaaseen itseohjattuun temppuun: Abstrakti – Rekonstruktio. Agentti tiivistää Simulink-mallin ja yrittää rakentaa sen uudelleen pelkän tiivistelmän avulla. Tämä pakottaa sen yhdistämään korkean tason tarkoituksen ja matalan tason toteutuksen juuri kuten oikeat insinöörit tekevät.
Vertailuarvo on todellinen, ei synteettinen. SimuBench sisältää 5 300 tehtävää ohjaus-, sähkö-, mekaanis-, lämpö-, neste- ja sähkömagneettisissa järjestelmissä. Luominen. Muokkaus. QA. Pieniä malleja ja isoja.
...

Johtavat
Rankkaus
Suosikit
