Tämä kaveri on mahtava plussa. WebAssembly (WASM) -tulkki on upotettu kovakoodatulla tavalla muuntamallin painoihin, ja se on häviöttömänä. Tämä vastaa oikean tietokoneen ajamista LLM:n sisällä. Tietokone voi oikeasti suorittaa suorituslaskelmia, eikä vain päätellä kuten useimmat nykyiset mallit. Tämä idea muistuttaa hieman TI:n dsp-piiriä, ARM vastaa loogisesta ajattelusta, ja DSP on omistettu nopeaan datalaskentaan. Jokaisen tulisi hyödyntää vahvuutensa. Esimerkiksi LLM:t eivät pysty selvittämään, mikä iso ongelma on 3.11 vai 3.8 rakentamalla hybridiarkkitehtuurin: 1. Neuroverkot vastaavat päättelystä ja ymmärryksestä 2. Upotettu tulkki / laskentamoottori vastaa tarkkoista laskelmista Näin se voi ottaa huomioon sekä älykkään päättelyn kyvyn että deterministisen laskennan tarkkuuden. Tästä on suuri hyöty numeerisissa laskelmissa, fyysisissä simulaatioissa, taloudellisessa mallinnuksessa ja kryptografisissa operaatioissa.