Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Phần mà hầu hết mọi người sẽ bỏ qua: NVIDIA vừa biến mọi API AI giọng nói thành hàng hóa.
OpenAI tính phí $0.06/phút cho đầu vào và $0.24/phút cho đầu ra cho API Realtime. Gemini Live tính phí 25 token/giây âm thanh. Mỗi startup xây dựng đại lý giọng nói đang tiêu tốn rất nhiều tiền cho phí API theo phút để vận hành một vấn đề cơ bản: ASR → LLM → TTS, ba mô hình được ghép lại với nhau với độ trễ ở mỗi mối nối.
PersonaPlex thay thế toàn bộ quy trình đó bằng một mô hình 7B. Chạy trên một A100 duy nhất. Mở trọng số, giấy phép MIT, cho phép sử dụng thương mại. Độ trễ phản hồi: 0.170 giây cho việc chuyển lượt, 0.240 giây cho các sự gián đoạn.
Nó đạt điểm cao hơn về tính tự nhiên trong đối thoại so với Gemini (2.95 so với 2.80 MOS) và xử lý sự gián đoạn tốt hơn mọi hệ thống thương mại mà họ đã đánh giá.
Điều này cho bạn biết mọi thứ về sách lược của NVIDIA. Họ không cần tính phí cho mô hình. Họ cần bạn mua GPU. Mỗi công ty tự lưu trữ PersonaPlex thay vì trả tiền cho OpenAI theo phút là một lần bán A100/H100 khác. Mỗi startup đại lý giọng nói từ bỏ sự phụ thuộc vào API của họ là một hợp đồng GPU doanh nghiệp khác.
NVIDIA đã mã nguồn mở cần câu cá vì họ bán hồ. Được xây dựng trên kiến trúc Moshi từ Kyutai, tinh chỉnh với dưới 5,000 giờ dữ liệu.
Biên lợi nhuận AI giọng nói đang di chuyển từ lớp ứng dụng sang lớp phần cứng. Và NVIDIA là công ty duy nhất có lợi nhuận bất kể mô hình nào thắng.
330,000 lượt tải trong tháng đầu tiên. Đó là việc chiếm lĩnh cơ sở hạ tầng được ngụy trang dưới dạng lòng tốt.
Hàng đầu
Thứ hạng
Yêu thích
