Meituan đã chính thức phát hành và công bố mã nguồn mở LongCat-2.0, một mô hình ngôn ngữ lớn kiểu Hỗn hợp Chuyên gia (MoE) khổng lồ với tổng cộng 1.6 nghìn tỷ tham số, và trung bình khoảng 48 tỷ tham số được kích hoạt cho mỗi token. 💥
Sự kiện này đánh dấu một cột mốc quan trọng trong phát triển AI toàn cầu: LongCat-2.0 là mô hình đầu tiên thuộc lớp nghìn tỷ tham số được đào tạo hoàn toàn trên một cụm máy tính nội địa Trung Quốc, sử dụng hơn 50.000 chip AI ASIC "cây nhà lá vườn", hoàn toàn không cần đến phần cứng của Nvidia. Điều này cho thấy sự tự chủ vượt trội của Trung Quốc trong lĩnh vực AI.
Những Đột Phá Kỹ Thuật Chính và Kiến Trúc Nổi Bật 🛠️
* Kiến trúc MoE Tỷ Tham Số: LongCat-2.0 sở hữu tổng cộng 1.6 nghìn tỷ tham số, với khoảng 48 tỷ tham số được kích hoạt trên mỗi token. Thiết kế này không chỉ mang lại dung lượng khổng lồ mà còn đảm bảo tốc độ suy luận hiệu quả. * Đào tạo quy mô lớn bằng phần cứng nội địa: Mô hình được huấn luyện trên một cụm gồm hơn 50.000 chip AI ASIC do Trung Quốc sản xuất, sử dụng tập dữ liệu lên tới hơn 35 nghìn tỷ token. Đây là minh chứng rõ ràng cho khả năng tự chủ phần cứng của nước này. * Phát triển đội ngũ thần tốc: Đội ngũ LongCat AI của Meituan chỉ được thành lập vào cuối năm 2023. Trong vòng chưa đầy ba năm, họ đã tiến bộ từ phiên bản đầu tiên (LongCat-Flash-Chat, mô hình MoE 560B) lên một mô hình tỷ tham số hiện đại. * Vượt qua các lệnh cấm vận xuất khẩu của Mỹ: Bất chấp các biện pháp kiểm soát xuất khẩu chip AI tiên tiến (như dòng H100, H200 và Blackwell của Nvidia) do Mỹ áp đặt từ năm 2022, thành công của Meituan chứng tỏ Trung Quốc đã xây dựng được một hệ sinh thái phần cứng và phần mềm nội địa toàn diện, có khả năng phát triển các mô hình nền tảng tỷ tham số. 🚀 Đây là một thành tựu đáng nể trong bối cảnh địa chính trị căng thẳng.
Khả Năng Lập Trình & Tác Tử Đạt Chuẩn SOTA 💻
Trước khi chính thức phát hành mã nguồn mở trên Hugging Face, phiên bản xem trước của LongCat-2.0 đã có mặt trên OpenRouter và longcat.ai. Mô hình này nhanh chóng lọt vào top ba về lượng cuộc gọi trên OpenRouter nhờ hiệu suất vượt trội của nó:
* SWE-bench Pro & Đa ngôn ngữ: LongCat-2.0 đạt điểm 59.5 trên SWE-bench Pro và 77.3 trên SWE-bench Multilingual. Trên các điểm chuẩn kỹ thuật phần mềm này, nó đã vượt qua các mô hình lớn của phương Tây như Gemini 3.1 Pro của Google và GPT-5.5 của OpenAI, chỉ xếp sau Claude 4.7/4.8 Opus của Anthropic. Một hiệu suất đáng kinh ngạc! * Khoảng cách về Khả năng Suy luận và Đánh giá: Mặc dù xuất sắc trong các tác vụ lập trình và tác tử, LongCat-2.0 vẫn còn kém các mô hình của OpenAI và Gemini trong một số điểm chuẩn suy luận cụ thể, với điểm số 90.0 trên IFEval, 81.8 trên IMO-AnswerBench, và 88.9 trên GPQA-diamond. Đây là lĩnh vực mà Meituan cần tiếp tục cải thiện.
Cách Thức Truy Cập và Khả Dụng 🌐
Meituan đã công bố mã nguồn mở LongCat-2.0 theo giấy phép tự do. Các tài nguyên chính bao gồm: * Kho lưu trữ mô hình: Có sẵn trên Hugging Face tại meituan-longcat/LongCat-2.0. * Truy cập API: Hỗ trợ qua OpenRouter (openrouter.ai) và Nền tảng LongCat chính thức. * Giao diện trực tuyến: Có thể thử nghiệm tại longcat.ai và longcat.chat.