Liên minh AI (AI Alliance), một liên minh phi lợi nhuận về nghiên cứu AI và công nghệ mã nguồn mở với hơn 200 tổ chức thành viên (bao gồm IBM, Meta và nhiều trường đại học toàn cầu), đã chính thức ra mắt Project Tapestry.
Sáng kiến mới này hướng tới việc xây dựng một nền tảng mã nguồn mở, phân tán toàn cầu để đồng huấn luyện các mô hình AI tiên tiến. Để dẫn dắt nỗ lực này, Liên minh AI công bố rằng nhà khoa học đoạt giải Turing và Trưởng Khoa học AI của Meta, Yann LeCun, đã tham gia với vai trò Cố vấn Khoa học Trưởng để định hướng khoa học cho cả Liên minh và Project Tapestry. Đây là một động thái chiến lược, cho thấy sự nghiêm túc của dự án trong việc kiến tạo một tương lai AI công bằng hơn. 🌟
---
Tầm nhìn: Vượt ra ngoài khái niệm 'Chỉ mã nguồn mở' 🤔
Trong phát triển AI hiện đại, các mô hình 'mã nguồn mở' (open weights) đã trở nên phổ biến, nhưng quá trình huấn luyện chúng vẫn tập trung cao độ. Yann LeCun đã nhấn mạnh hạn chế này:
> "Ngày nay, các mô hình AI có mã nguồn mở ở khắp mọi nơi. Nhưng bản thân mã nguồn mở không làm cho quá trình huấn luyện trở nên có sự tham gia. Cơ sở hạ tầng, các luồng dữ liệu và các quyết định thiết kế đằng sau các mô hình này vẫn tập trung ở một số ít công ty và khu vực. Hầu hết thế giới chỉ tải xuống kết quả. Gần như không ai định hình quá trình." > — Yann LeCun, Cố vấn Khoa học Trưởng
Project Tapestry giải quyết khoảng trống này bằng cách tạo ra một kiến trúc nơi các tổ chức, ngành công nghiệp và quốc gia có thể đồng huấn luyện một mô hình nền tảng mở chung. Quan trọng hơn, họ có thể làm điều đó trong khi vẫn giữ quyền kiểm soát hoàn toàn dữ liệu của mình và xây dựng các sản phẩm phái sinh có chủ quyền, phù hợp với ưu tiên, luật pháp và văn hóa riêng của họ. Đây là một bước tiến lớn hướng tới sự phi tập trung hóa trong phát triển AI. ✊
---
Kiến trúc cốt lõi: 'Sở hữu dữ liệu của bạn, chia sẻ mô hình' 🤝
Project Tapestry được xây dựng trên kiến trúc kỹ thuật N+1, bao gồm:
1. Mô hình nền tảng cốt lõi chung: Được phát triển tập trung thông qua sự phối hợp hợp tác của liên minh. 2. Các nút tham gia có chủ quyền: Các bên tham gia tại địa phương nhận, điều chỉnh và tiếp tục huấn luyện mô hình bằng bộ dữ liệu riêng của họ. 3. Trao đổi trọng số mà không rò rỉ dữ liệu: Các cải tiến trọng số và gradient được chia sẻ trở lại để cải thiện mô hình nền tảng, nhưng dữ liệu huấn luyện thô không bao giờ rời khỏi nút cục bộ của bất kỳ bên tham gia nào.
Mô hình học tập liên kết này giải quyết tắc nghẽn về tính toán và dữ liệu cho các quốc gia có chủ quyền. Như Tiến sĩ Christopher Nguyen, CEO của Aitomatic và thành viên Hội đồng Liên minh AI, giải thích:
> "Cho đến nay, nhiều nỗ lực AI có chủ quyền và theo ngành cụ thể đã phải đối mặt với rào cản lớn về tính toán, quyền truy cập dữ liệu, tài trợ và nhân tài chuyên biệt. Project Tapestry được thiết kế để vượt qua hạn chế đó thông qua hợp tác liên kết. Ý tưởng rất đơn giản nhưng mạnh mẽ: xây dựng một nền tảng chung toàn cầu một cách mở, sau đó cho phép mỗi bên tham gia mở rộng theo cách họ hoàn toàn sở hữu và kiểm soát."
Điều này thể hiện một tầm nhìn thực sự dân chủ hóa công nghệ AI. 💡
---
Các cột mốc kỹ thuật quan trọng Giai đoạn 0 (2026–2027) 🗓️
Kho lưu trữ GitHub của dự án (The-AI-Alliance/tapestry) đã hoạt động, và Giai đoạn 0 phác thảo một số mục tiêu phát triển mã nguồn mở trước mắt:
* Danh mục dữ liệu huấn luyện: Xây dựng một sổ đăng ký siêu dữ liệu liên quan đến các nguồn dữ liệu ứng cử viên có sẵn cho liên minh để thiết lập một kho ngữ liệu toàn cầu chất lượng cao. * Giao thức huấn luyện của Liên minh: Phát triển các nguyên mẫu trong src/tapestry/training/consortium/ để cân bằng giữa điều phối tập trung với huấn luyện phân tán bảo vệ quyền riêng tư. * Điều chỉnh và tái điều chỉnh văn hóa LLM: Phát triển các kỹ thuật để điều chỉnh các mô hình phù hợp với bối cảnh văn hóa địa phương bằng cách sử dụng các chỉ số như Bản đồ văn hóa Inglehart–Welzel, cho phép các quốc gia điều chỉnh mô hình nền tảng mà không ảnh hưởng đến khả năng logic chung. Đây là điểm mấu chốt để AI thực sự phục vụ đa dạng văn hóa toàn cầu. 🌍
---
Sáng kiến BharatGen của Ấn Độ và IIT Bombay dẫn đầu 🇮🇳
Trong một động thái kỹ thuật lớn, sáng kiến BharatGen của Ấn Độ (do IIT Bombay dẫn đầu dưới sự bảo trợ của Sứ mệnh IndiaAI của nhà nước) đã cam kết neo giữ vai trò của Ấn Độ như một nhà đóng góp sáng lập cho Project Tapestry. Sự tham gia này đảm bảo rằng Ấn Độ có thể xây dựng các mô hình AI tiên tiến dựa trên ngôn ngữ, bối cảnh văn hóa và cơ sở tri thức địa phương của riêng mình, thay vì chỉ phụ thuộc vào các mô hình nền tảng tập trung từ phương Tây. Điều này nhấn mạnh tầm quan trọng của chủ quyền dữ liệu và văn hóa trong kỷ nguyên AI. ✨
Tiến sĩ Anthony Annunziata, Chủ tịch Liên minh AI và Giám đốc Đổi mới Mở tại IBM, đã tóm tắt sứ mệnh dân chủ của Tapestry:
> "Tri thức và trí thông minh của nhân loại dùng để xây dựng AI không nằm ở bất kỳ tổ chức nào. AI có năng lực và đáng tin cậy nhất cũng không thể tập trung ở một nơi."
Một thông điệp mạnh mẽ về tầm nhìn AI vì cộng đồng toàn cầu. 🗣️