Alguém no subreddit local do llama já quantizou o nosso modelo para o formato gguf q4 e o usou localmente para gerar uma aplicação dinâmica de sistema solar em JavaScript. Impressionante desempenho em uma única execução, na minha opinião, especialmente para q4.