Các nhà nghiên cứu của Google phát hiện rằng các mô hình lý luận tiên tiến đạt được trí thông minh vượt trội bằng cách tự phát mô phỏng các tương tác nội bộ giống như nhiều tác nhân, thay vì chỉ dựa vào tính toán dài hơn hoặc quy mô lớn hơn. Các mô hình này phát triển một "cấu trúc xã hội" nội bộ, nơi các nhân vật mô phỏng đa dạng tranh luận và hòa giải ý tưởng để giải quyết các vấn đề phức tạp.
"chúng tôi nhận thấy rằng các mô hình lý luận như DeepSeek-R1 và QwQ-32B thể hiện sự đa dạng quan điểm lớn hơn nhiều so với các mô hình cơ bản và chỉ được tinh chỉnh theo hướng dẫn"
85