Quelqu'un sur le subreddit local llama a déjà quantifié notre modèle au format gguf q4 et l'utilise localement pour générer une application dynamique de système solaire 3D en JavaScript. Une performance impressionnante en un seul coup, à mon avis, surtout pour le q4.