AI 1 thg 6, 2026 2 phút đọc

MiniMax M3: Mô hình mở 1 triệu token thách thức các đối thủ đóng

MiniMax (Trung Quốc) vừa phát hành M3, một mô hình 'open-weight' hỗ trợ ngữ cảnh 1 triệu token, cạnh tranh trực tiếp với Gemini 1.5 Pro và GPT-4o.

Tier 1 · nguồn 81% độ tin cậy Đã được duyệt

Nguồn gốc the-decoder.com

MiniMax, kỳ lân AI của Trung Quốc, đã chính thức giới thiệu M3, một mô hình ngôn ngữ lớn (LLM) với khả năng xử lý ngữ cảnh lên tới 1 triệu token. Điểm đặc biệt của M3 là cấu trúc 'open-weight', cho phép cộng đồng nghiên cứu và nhà phát triển tiếp cận trọng số mô hình một cách linh hoạt hơn so với các đối thủ đóng như GPT-4o của OpenAI hay Gemini 1.5 của Google.

Bối cảnh

M3 được xây dựng trên kiến trúc hỗn hợp các chuyên gia (MoE) tiên tiến, giúp tối ưu hóa hiệu suất tính toán trong khi vẫn duy trì khả năng xử lý lượng dữ liệu khổng lồ. Việc hỗ trợ 1 triệu token cho phép mô hình 'đọc' toàn bộ các tập tài liệu pháp lý phức tạp, hàng chục cuốn sách hoặc toàn bộ kho mã nguồn trong một lần truy vấn duy nhất. Trước M3, chỉ có một vài mô hình như Gemini 1.5 Pro của Google là thực sự thương mại hóa tốt khả năng xử lý ngữ cảnh dài mức triệu token.

Vì sao đáng chú ý

Sự ra đời của M3 đánh dấu bước tiến quan trọng của các công ty AI Trung Quốc trong việc thu hẹp khoảng cách với Thung lũng Silicon. Việc phát hành dưới dạng open-weight không chỉ giúp MiniMax thu hút sự chú ý của giới phát triển toàn cầu mà còn tạo ra một giải pháp thay thế mạnh mẽ cho những ai cần xử lý ngữ cảnh dài mà không muốn bị khóa vào hệ sinh thái của các Big Tech. Theo các thử nghiệm nội bộ, M3 cho thấy khả năng truy xuất thông tin (needle-in-a-haystack) ổn định ngay cả ở giới hạn 1 triệu token, hứa hẹn thay đổi cách xây dựng các ứng dụng RAG (Retrieval-Augmented Generation) phức tạp.