Công ty trí tuệ nhân tạo MiniMax vừa chính thức phát hành mã nguồn mở cho mô hình ngôn ngữ lớn mới nhất mang tên MiniMax M3 trên nền tảng Hugging Face, với sự hỗ trợ kỹ thuật từ Novita. Đây là một bước đi đáng chú ý của hãng công nghệ này khi tung ra một mô hình dạng hỗn hợp chuyên gia (MoE) có kích thước khổng lồ, được thiết kế đặc biệt nhằm tối ưu hóa cho kỷ nguyên của các tác nhân AI (AI Agent) tự hoạt động.
Diễn biến
Theo thông tin công bố từ nhà phát triển, MiniMax M3 sở hữu tổng cộng khoảng 428 tỷ tham số, nhưng chỉ có khoảng 23 tỷ tham số được kích hoạt cho mỗi lượt xử lý (token). Việc tối ưu hóa cấu trúc MoE này giúp mô hình duy trì được năng lực xử lý ngôn ngữ và suy luận phức tạp của một mô hình cực lớn, trong khi vẫn giảm thiểu đáng kể tài nguyên điện toán cần thiết khi vận hành thực tế.
Sự đồng hành của Novita trong đợt phát hành này được kỳ vọng sẽ giúp các nhà phát triển dễ dàng tích hợp và tối ưu hóa hiệu năng của MiniMax M3 trên các hệ thống đám mây phổ biến hiện nay.
Vì sao đáng chú ý
Việc MiniMax chọn con đường mở mã nguồn cho một mô hình có cấu trúc đồ sộ như M3 cho thấy xu hướng dân chủ hóa AI đang tiếp tục lan rộng, thách thức các mô hình đóng độc quyền từ các ông lớn phương Tây. Đối với cộng đồng công nghệ tại Việt Nam, sự xuất hiện của MiniMax M3 mở ra thêm một lựa chọn chất lượng cao để tự thử nghiệm và xây dựng các hệ thống AI Agent độc lập mà không lo ngại về chi phí API đắt đỏ. Dẫu vậy, giới phát triển vẫn cần thêm thời gian để đánh giá thực tế xem liệu năng lực suy luận của mô hình này có thực sự vượt trội hay chỉ dừng lại ở các thông số lý thuyết được nhà sản xuất công bố.