Bài báo mới phân tích dữ liệu sử dụng API LLM với hơn 100T token (OpenRouter + Azure). Những phát hiện chính: -Cung đã bùng nổ vào năm 2025: 253→651 mô hình, nhà cung cấp suy diễn 27→90, một số mô hình mã nguồn mở được phục vụ bởi hơn 20 nhà cung cấp -Nghịch lý giá cả: giảm phát 1000x kể từ SOTA năm 2023, nhưng chi tiêu trung bình mỗi token vẫn ổn định. Người dùng tiết kiệm bằng cách mua nhiều trí tuệ hơn, không phải nhiều khối lượng hơn. -Mã nguồn mở rẻ hơn 90% ở chất lượng chuẩn tương đương nhưng chỉ chiếm <30% thị phần. Sự khác biệt không phải về giá (độ tin cậy, công cụ, cảm giác) là có thật. -Tỷ lệ thay đổi cực kỳ cao: mô hình hàng đầu chỉ giữ vị trí dẫn đầu trong vài tháng trước khi bị thay thế. 10 mô hình hàng đầu hôm nay có 20% thị phần cách đây 4 tháng, không tồn tại 10 tháng trước. Không có người chiến thắng tuyệt đối. -Sự sẵn sàng chi trả thay đổi rất lớn theo từng trường hợp sử dụng: SEO trả $1.40/M token, dịch thuật $0.17, pháp lý $0.16. Hầu hết việc sử dụng vẫn dưới mức trí tuệ tiên tiến. -Độ co giãn giá ngắn hạn ~1.1, vì vậy chưa có nghịch lý Jevons. Giảm giá sẽ không kích thích nhu cầu tính toán bùng nổ. Ma sát tích hợp là rào cản chính, không phải chi phí.