SciAgentArena: Chuẩn Đoán Năng Lực Đặc Vụ AI Trong Khoa Học Thực Tế 🧪🔬
Nghiên cứu mới giới thiệu SciAgentArena, một nền tảng chuẩn hóa đặc vụ AI trong khoa học thực tế với 200 nhiệm vụ, tiết lộ rằng chúng mạnh ở phân tích dữ liệu rõ ràng nhưng còn hạn chế trong việc tạo ra đột phá hay xử lý các vấn đề nghiên cứu mở.
