Denne kompisen er en fantastisk pluss. En WebAssembly (WASM)-tolk er innebygd på en hardkodet måte i vektene til transformatormodellen, og den er tapsfri. Dette tilsvarer å kjøre en ekte datamaskin inne i en LLM. Datamaskinen kan faktisk utføre kjørende beregninger, i stedet for bare å slutte slutninger slik de fleste modeller gjør i dag. Denne ideen ligner litt på TI sin dsp-brikke, ARM er ansvarlig for logisk tenkning, og DSP er dedikert til høyhastighets databeregning. Hver av dem bør utnytte sine styrker. For eksempel klarer ikke LLM-er å finne ut hvilket stort problem som er 3.11 eller 3.8 ved å bygge en hybridarkitektur: 1. Nevrale nettverk er ansvarlige for resonnering og forståelse 2. Innebygd tolk / beregningsmotor er ansvarlig for høypresisjonsberegninger På denne måten kan den ta hensyn til både intelligent resonnement og deterministisk beregningsnøyaktighet. Dette er til stor nytte for numeriske beregninger, fysiske simuleringer, finansiell modellering og kryptografiske operasjoner.