Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Anh chàng này thật tuyệt vời. Đã nhúng một trình thông dịch WebAssembly (WASM) vào trọng số của mô hình Transformer theo cách hard-coded, và hoàn toàn không mất dữ liệu (losslessly). Điều này tương đương với việc chạy một máy tính thực sự bên trong LLM. Chiếc máy tính này có thể thực hiện các phép tính thực tế (run computations), thay vì chỉ đưa ra kết quả tính toán như hầu hết các mô hình hiện nay thông qua infer. Ý tưởng này có phần tương tự như chip dsp của TI, arm chịu trách nhiệm về tư duy logic, sau đó dsp chuyên trách tính toán dữ liệu tốc độ cao. Mỗi bên phát huy thế mạnh của mình. Vậy thì, so sánh một chút, vấn đề LLM không thể tính chính xác 3.11 và 3.8 cái nào lớn hơn có thể được giải quyết bằng cách xây dựng một kiến trúc hỗn hợp (hybrid architectures): 1. Mạng nơ-ron chịu trách nhiệm về suy luận và hiểu biết (reasoning) 2. Trình thông dịch nhúng / động cơ tính toán chịu trách nhiệm về tính toán độ chính xác cao Như vậy, có thể đồng thời đảm bảo khả năng suy luận thông minh và độ chính xác tính toán xác định. Điều này rất có lợi cho tính toán số, mô phỏng vật lý, mô hình tài chính, và các phép toán mật mã.

Hàng đầu

Thứ hạng

Yêu thích