Tài nguyên khan hiếm nhất mà bạn có với tư cách là một kỹ sư chính là thời gian của chính bạn. Các mô hình khác nhau có hiệu suất khác nhau cho các tác vụ khác nhau và tất cả các LLM đôi khi có thể không ổn định, vì vậy một cách tự nhiên để tiết kiệm thời gian khi lập trình là chạy cùng một tác vụ trên nhiều mô hình cùng một lúc, sau đó so sánh kết quả và quyết định mô hình nào bạn muốn làm việc. Một trong những tác dụng phụ thú vị của điều này là chúng ta có thể có được bài đánh giá lập trình thực tế tự nhiên nhất! Mọi người đều biết việc đạt điểm tối đa trên một tập hợp các tác vụ cố định dễ dàng như thế nào; bài đánh giá này là một thử nghiệm thực sự về mô hình nào hoạt động tốt nhất cho các nhà phát triển trong công việc hàng ngày của họ.