Một người trên subreddit local llama đã định lượng mô hình của chúng tôi sang định dạng gguf q4 và sử dụng nó tại chỗ để tạo ra ứng dụng hệ mặt trời 3D động bằng java script. Thực sự ấn tượng với hiệu suất một lần, theo ý kiến của tôi, đặc biệt là đối với q4.