Vào ngày 16 tháng 6 năm 2026, ZAI chính thức ra mắt GLM-5.2, mô hình nền tảng chủ lực mới nhất của họ, được xây dựng cho các tác vụ tác tử (agentic tasks) dài hạn và kỹ thuật hệ thống. Với 753 tỷ tham số, GLM-5.2 được phát hành theo giấy phép MIT cực kỳ tự do, cho phép các tổ chức tải xuống, vận hành và tự lưu trữ mô hình nguồn mở này trên hạ tầng của riêng họ. Đây là một động thái đáng chú ý, mở ra cơ hội lớn cho giới doanh nghiệp muốn kiểm soát hoàn toàn dữ liệu và chi phí. 📈
Lần đầu tiên, GLM-5.2 mang lại khả năng tác tử hàng đầu với cửa sổ ngữ cảnh ổn định lên đến 1 triệu token, duy trì bền vững các quỹ đạo phát triển phức tạp và các luồng công việc kinh doanh dài hơi. Điều này đặc biệt quan trọng cho các ứng dụng đòi hỏi sự hiểu biết sâu rộng và lập kế hoạch dài hạn. ✨
Đột Phá Kiến Trúc Chính: IndexShare & Giải Mã Suy Đoán
Để hỗ trợ thực thi thông lượng cao, độ trễ thấp ở độ dài ngữ cảnh khổng lồ 1 triệu token, đội ngũ ZAI đã giới thiệu hai đột phá lớn trong thiết kế đồng bộ phần cứng-thuật toán trong GLM-5.2: 💡
1. Kiến Trúc IndexShare (Tối Ưu Hóa Chú Ý Thưa Thớt - Sparse Attention Optimization): GLM-5.2 đề xuất IndexShare (đã được mô tả trước đó trong arXiv:2603.12201), tái sử dụng cùng một bộ lập chỉ mục trên mỗi bốn lớp chú ý thưa thớt. Điều này giúp giảm FLOPs trên mỗi token tới 2.9 lần ở độ dài ngữ cảnh 1 triệu, cắt giảm đáng kể chi phí điện toán khi tự lưu trữ. Một bước tiến quan trọng cho hiệu quả tài nguyên! 💸
2. Cải Thiện Giải Mã Suy Đoán MTP (Multi-Token Prediction): Giải mã suy đoán được tối ưu hóa với một lớp MTP tinh chỉnh, giúp tăng độ dài chấp nhận chuỗi lên tới 20%, từ đó tăng thông lượng tạo ra trong các tác vụ tác tử phức tạp. Nhanh hơn, hiệu quả hơn! ⚡
3. Khả Năng Lập Trình Nâng Cao với Nỗ Lực Linh Hoạt (Flexible Effort): GLM-5.2 cho phép các nhà phát triển điều chỉnh linh hoạt mức độ "suy nghĩ" của mô hình. Các tác vụ đòi hỏi nỗ lực cao sẽ áp dụng tìm kiếm và suy luận nội bộ sâu sắc để giải quyết các vấn đề kỹ thuật phần mềm phức tạp, trong khi các tác vụ nỗ lực thấp mang lại thời gian phản hồi nhanh chóng cho các tương tác hội thoại. Điều này mang lại sự linh hoạt đáng giá cho nhiều trường hợp sử dụng. 🧑💻
Hiệu Suất Vượt Trội: Thách Thức Biên Giới Nguồn Đóng
GLM-5.2 đạt được những đột phá đáng kể trên các điểm chuẩn quan trọng về lập trình, sử dụng công cụ và lập kế hoạch dài hạn, thách thức trực tiếp các mô hình độc quyền. Liệu nó có đủ sức lật đổ các ông lớn? 🤔
* Terminal-Bench 2.1: GLM-5.2 đạt 81.0 điểm, cải thiện đáng kể so với 62.0 của GLM-5.1 và thu hẹp khoảng cách với Claude Opus 4.8 (85.0) đang dẫn đầu, đồng thời vượt trội hơn hẳn Gemini 3.1 Pro. Một bước nhảy vọt đáng nể! 🏆 * SWE-bench Pro: Mô hình này đạt điểm số nguồn mở hàng đầu với 62.1 (so với 58.4 của GLM-5.1), củng cố vị thế là mô hình nguồn mở mạnh nhất cho kỹ thuật phần mềm tự động. 🛠️ * τ²-Bench: Trong các kịch bản tác tử đa bước phức tạp, GLM-5.2 đạt 89.7, tiệm cận 91.6 của Claude Opus 4.5 và vượt qua 85.5 của GPT-5.2. Hiệu suất ấn tượng trong các tác vụ phức tạp! ✨ * Vending Bench 2 (Tính Nhất Quán Dài Hạn & Ngân Sách): Được đánh giá độc lập bởi Andon Labs, Vending Bench 2 giao nhiệm vụ cho các tác tử AI điều hành một doanh nghiệp máy bán hàng tự động mô phỏng trong vòng một năm. Điểm số dựa trên số dư tài khoản ngân hàng cuối cùng, đánh giá chiến lược bền vững, quản lý tài nguyên và lập ngân sách. GLM-5.2 đã về thứ hai chung cuộc, tiệm cận Claude Opus và vượt trội GPT-5.2, nhưng quan trọng hơn là đạt được điều đó với chi phí API token ÍT HƠN MỘT NỬA so với Claude Opus. Tiết kiệm chi phí đáng kinh ngạc mà vẫn giữ hiệu suất cao! 💰
Giấy Phép Mở Rộng & Hệ Sinh Thái Nguồn Mở
Bằng cách phát hành GLM-5.2 dưới dạng nguồn mở với giấy phép MIT, ZAI đang thách thức sự thống trị của các API độc quyền (như Claude hay OpenAI Enterprise). Các doanh nghiệp đang phải trả những hóa đơn đăng ký cắt cổ cho các API độc quyền giờ đây có thể tự lưu trữ một mô hình có năng lực tương đương, tùy chỉnh nó thông qua fine-tuning sâu (LoRA/DoRA) cho các nền tảng phát triển nội bộ của riêng họ, đồng thời duy trì quyền riêng tư dữ liệu tuyệt đối. Đây là một lời hứa hẹn về tự do và kiểm soát, điều mà các giải pháp đóng khó có thể mang lại. 🔐