Den här kompisen är en fantastisk bonus. En WebAssembly (WASM)-tolk är inbäddad på ett hårdkodat sätt i vikterna i transformatormodellen, och den är förlustfri. Detta motsvarar att köra en riktig dator inuti ett LLM. Datorn kan faktiskt utföra körberäkningar, istället för att bara dra slutsatser som de flesta modeller gör idag. Den här idén liknar lite TI:s DSP-chip, ARM ansvarar för logiskt tänkande, och DSP är dedikerat till höghastighetsdataberäkning. Var och en bör dra nytta av sina styrkor. Till exempel kan LLM:er inte avgöra vilket stort problem som är 3.11 eller 3.8 genom att bygga en hybridarkitektur: 1. Neurala nätverk ansvarar för resonemang och förståelse 2. Inbäddad tolk / beräkningsmotor ansvarar för högprecisionsberäkningar På detta sätt kan den ta hänsyn till både intelligent resonemangsförmåga och deterministisk beräkningsnoggrannhet. Detta är till stor nytta för numeriska beräkningar, fysiska simuleringar, finansiell modellering och kryptografiska operationer.