AI có thể không cần dữ liệu huấn luyện khổng lồ sau tất cả | Hannah Robbins, Đại học Johns Hopkins Tóm tắt: Nghiên cứu mới cho thấy AI không cần dữ liệu huấn luyện vô tận để bắt đầu hành động giống như một bộ não con người. Khi các nhà nghiên cứu thiết kế lại các hệ thống AI để giống hơn với bộ não sinh học, một số mô hình đã tạo ra hoạt động giống như não mà không cần bất kỳ huấn luyện nào. Điều này thách thức cách tiếp cận hiện tại của việc phát triển AI cần nhiều dữ liệu. Công việc này gợi ý rằng thiết kế thông minh hơn có thể tăng tốc độ học tập một cách đáng kể trong khi giảm chi phí và tiêu thụ năng lượng. --- Nghiên cứu mới từ Đại học Johns Hopkins cho thấy rằng các hệ thống trí tuệ nhân tạo được xây dựng với thiết kế lấy cảm hứng từ sinh học có thể bắt đầu giống với hoạt động của bộ não con người ngay cả trước khi chúng được huấn luyện trên bất kỳ dữ liệu nào. Nghiên cứu gợi ý rằng cách mà AI được cấu trúc có thể quan trọng không kém gì lượng dữ liệu mà nó xử lý. Các phát hiện, được công bố trên tạp chí Nature Machine Intelligence, thách thức chiến lược thống trị trong phát triển AI. Thay vì dựa vào hàng tháng huấn luyện, tập dữ liệu khổng lồ và sức mạnh tính toán lớn, nghiên cứu nhấn mạnh giá trị của việc bắt đầu với một nền tảng kiến trúc giống như não. Suy nghĩ lại về cách tiếp cận nặng về dữ liệu đối với AI "Cách mà lĩnh vực AI đang phát triển hiện nay là ném một đống dữ liệu vào các mô hình và xây dựng tài nguyên tính toán có kích thước như các thành phố nhỏ. Điều đó yêu cầu chi hàng trăm tỷ đô la. Trong khi đó, con người học cách nhìn bằng rất ít dữ liệu," tác giả chính Mick Bonner, phó giáo sư khoa học nhận thức tại Đại học Johns Hopkins cho biết. "Sự tiến hóa có thể đã hội tụ vào thiết kế này vì một lý do chính đáng. Công việc của chúng tôi gợi ý rằng các thiết kế kiến trúc giống như não đặt các hệ thống AI vào một điểm khởi đầu rất thuận lợi." Bonner và các đồng nghiệp của ông đã nhằm thử nghiệm xem liệu kiến trúc một mình có thể mang lại cho các hệ thống AI một điểm khởi đầu giống như con người, mà không cần dựa vào huấn luyện quy mô lớn. So sánh các kiến trúc AI phổ biến Nhóm nghiên cứu tập trung vào ba loại thiết kế mạng nơ-ron chính thường được sử dụng trong các hệ thống AI hiện đại: transformers, mạng kết nối đầy đủ và mạng nơ-ron tích chập. Họ đã điều chỉnh những thiết kế này nhiều lần để tạo ra hàng chục mạng nơ-ron nhân tạo khác nhau. Không có mô hình nào được huấn luyện trước. Các nhà nghiên cứu sau đó đã cho các hệ thống chưa được huấn luyện xem hình ảnh của các đối tượng, con người và động vật và so sánh hoạt động nội bộ của chúng với phản ứng não từ con người và động vật linh trưởng không phải người khi xem cùng một hình ảnh. Tại sao mạng nơ-ron tích chập nổi bật Tăng số lượng nơ-ron nhân tạo trong các transformers và mạng kết nối đầy đủ đã tạo ra ít thay đổi có ý nghĩa. Tuy nhiên, những điều chỉnh tương tự đối với các mạng nơ-ron tích chập đã dẫn đến các mẫu hoạt động gần giống với những gì thấy ở bộ não con người. Theo các nhà nghiên cứu, những mô hình tích chập chưa được huấn luyện này hoạt động tương đương với các hệ thống AI truyền thống thường yêu cầu tiếp xúc với hàng triệu hoặc thậm chí hàng tỷ hình ảnh. Kết quả cho thấy rằng kiến trúc đóng vai trò lớn hơn trong việc hình thành hành vi giống như não hơn là trước đây được tin tưởng. Một con đường nhanh hơn đến AI thông minh hơn ...