Joku paikallisessa llama-subredditissä on jo kvantisoinut mallimme gguf q4 -muotoon ja käyttänyt sitä paikallisesti dynaamisen 3D-aurinkojärjestelmän sovelluksen luomiseen Java-skriptillä Vaikuttava yhden laukauksen suorituskyky mielestäni erityisesti Q4:lle