🚨 Phát hành báo cáo kỹ thuật của chúng tôi: Tại sao LLM chưa phải là nhà khoa học @dhruvtrehan9 đã kiểm tra xem LLM có thể thực hiện nghiên cứu ML từ đầu đến cuối hay không. 3/4 nỗ lực đã thất bại. Một nỗ lực thành công và dẫn đến một bài báo được chấp nhận tại Agents4Science 2025, hội nghị đầu tiên trên thế giới dành cho các tác giả AI. Trong báo cáo, chúng tôi ghi lại sáu chế độ thất bại và bốn nguyên tắc thiết kế. 🧵