Clement Delangue, CEO của Hugging Face, vừa đưa ra lời kêu gọi cộng đồng cùng nhau chia sẻ công khai các "agent traces" (dấu vết hoạt động của tác nhân) và các dữ liệu lập trình. Theo ông, đây là chìa khóa để xây dựng các bộ dữ liệu huấn luyện và các mô hình mã nguồn mở tốt hơn trong tương lai.
Bối cảnh
Trong cuộc đua phát triển AI, các bộ dữ liệu chất lượng cao thường là tài sản được bảo mật nghiêm ngặt bởi các tập đoàn lớn. Hugging Face, với triết lý mã nguồn mở, đang nỗ lực phá vỡ rào cản này bằng cách khuyến khích sự đóng góp tự nguyện từ cộng đồng nhà phát triển toàn cầu.
Diễn biến
Delangue nhấn mạnh rằng việc chia sẻ không chỉ giúp ích cho các dự án cá nhân mà còn đóng góp vào sự phát triển chung của hệ sinh thái AI. "Agent traces" cung cấp cái nhìn sâu sắc về cách các mô hình giải quyết vấn đề, từ đó giúp cải thiện khả năng suy luận và thực thi của các mô hình thế hệ tiếp theo. Nhiều nhà phát triển hàng đầu đã bắt đầu đóng góp dữ liệu của họ lên Hugging Face Hub, tạo tiền đề cho một kho lưu trữ dữ liệu tác nhân khổng lồ.
Vì sao đáng chú ý
Dữ liệu là "nhiên liệu" của AI. Lời kêu gọi của Delangue phản ánh một chiến lược dài hạn: thay vì cạnh tranh bằng sức mạnh tính toán, cộng đồng mã nguồn mở có thể cạnh tranh bằng sự đa dạng và minh bạch của dữ liệu. Nếu thành công, phong trào này sẽ giúp rút ngắn khoảng cách giữa các mô hình đóng và mô hình mở trong lĩnh vực tác nhân AI đầy tiềm năng.