Những người tài năng được thăng chức lên quản lý. Các người mẫu tài năng cũng vậy. Claude quản lý việc thực thi mã. Gemini định tuyến các yêu cầu qua CRM & chat. GPT-5 có thể phối hợp nghiên cứu cổ phiếu công khai. Tại sao lại là bây giờ? Độ chính xác của công cụ gọi đã vượt qua một ngưỡng. Hai năm trước, GPT-4 chỉ thành công trong chưa đến 50% các nhiệm vụ gọi hàm. Các mô hình đã tưởng tượng ra các tham số, gọi sai các điểm cuối, quên ngữ cảnh giữa cuộc trò chuyện. Ngày nay, các mô hình SOTA vượt quá 90% độ chính xác trên các tiêu chuẩn gọi hàm. Hiệu suất của các mô hình gần đây nhất, như Gemini 3, thực tế tốt hơn nhiều so với những gì các tiêu chuẩn gợi ý.
Chúng ta có cần những mô hình với hàng triệu tham số chỉ để thực hiện các cuộc gọi hàm không? Thật bất ngờ, có. Các thí nghiệm với các mô hình hành động nhỏ, mạng nhẹ chỉ được đào tạo cho việc chọn công cụ, thất bại trong sản xuất. Chúng thiếu kiến thức về thế giới. Quản lý, hóa ra, cần có ngữ cảnh. Ngày nay, bộ điều phối thường tự phát sinh như một tác nhân phụ (Claude Code khởi động một Claude Code khác). Sự đối xứng này sẽ không kéo dài. Bài học cay đắng khẳng định rằng các mô hình ngày càng lớn hơn nên xử lý mọi thứ. Nhưng kinh tế lại phản đối: tinh chế & tinh chỉnh tăng cường tạo ra các mô hình nhỏ hơn 40% & nhanh hơn 60% trong khi vẫn giữ được 97% hiệu suất. Các tác nhân chuyên biệt từ các nhà cung cấp khác nhau đang xuất hiện. Mô hình biên giới trở thành giám đốc điều hành, định tuyến các yêu cầu qua các chuyên gia. Những chuyên gia này có thể là các nhà cung cấp bên thứ ba, tất cả đều cạnh tranh để trở thành tốt nhất trong lĩnh vực của họ.
66