Trong khi chúng tôi đã xây dựng ở phía sau, chúng tôi đã thực hiện các phép đo hiệu suất SERV Reasoning vượt trội hơn GPT-5 về độ chính xác, chi phí thấp hơn 96% và tạo ra kết quả nhất quán qua các lần chạy API công khai vẫn chưa hoạt động. Đây chỉ là những gì các số liệu ban đầu trông như thế nào