AI tools-ai 28 thg 6, 2026 2 phút đọc

Vercel Ra Mắt GLM 5.2 Fast Trên AI Gateway: Tốc Độ Xử Lý AI Tăng Gấp Đôi Nhờ Wafer! 🚀

Vercel vừa công bố tích hợp GLM 5.2 Fast vào AI Gateway, sử dụng công nghệ Wafer để mang lại thông lượng xử lý mô hình GLM-5.2 cao gấp đôi trên môi trường serverless, theo các đánh giá nội bộ của họ.

Tier 1 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc vercel.com

Vercel, nền tảng phát triển web hàng đầu, vừa thông báo tích hợp mô hình ngôn ngữ lớn GLM 5.2 Fast vào AI Gateway của mình, hứa hẹn mang lại hiệu suất vượt trội nhờ công nghệ Wafer.

Hiệu Suất Đột Phá Với Công Nghệ Wafer

Theo các đánh giá nội bộ của Vercel, GLM 5.2 Fast trên Wafer đạt thông lượng cao gấp đôi so với các nhà cung cấp khác khi triển khai GLM-5.2 trên nền tảng serverless. Hiệu suất này được thể hiện rõ ở tốc độ giải mã (decode) và tốc độ đầu cuối (end-to-end) cho quá trình tạo nội dung liên tục, đặc biệt trong các trường hợp ngữ cảnh nhỏ và lớn. 📈

Cụ thể, trong các bài kiểm tra của Vercel, GLM 5.2 Fast trên Wafer đã đo được:

* Ngữ cảnh nhỏ: Hơn 170 token/giây * Ngữ cảnh lớn: Hơn 200 token/giây

Để trải nghiệm GLM 5.2 Fast, các nhà phát triển chỉ cần thiết lập trường model thành zai/glm-5.2-fast trong AI SDK.

AI Gateway: Cổng Kết Nối AI Toàn Diện

AI Gateway không chỉ là một cầu nối đơn thuần mà còn là một nền tảng API hợp nhất, giúp các nhà phát triển dễ dàng gọi các mô hình AI, theo dõi mức sử dụng và chi phí. Nền tảng này còn cung cấp các tính năng tối ưu hóa hiệu suất như cấu hình thử lại (retries), chuyển đổi dự phòng (failover), và các cải tiến hiệu suất để đảm bảo thời gian hoạt động cao hơn so với các nhà cung cấp đơn lẻ. 🛠️

Các tính năng nổi bật khác bao gồm:

* Báo cáo tùy chỉnh tích hợp (custom reporting) * Hỗ trợ giữ lại dữ liệu bằng 0 (Zero Data Retention) * Quản lý ngân sách cho khóa API (budgets for API keys) * Và nhiều hơn nữa.

Chi Phí Minh Bạch, Không Phát Sinh

Về chi phí, Vercel cam kết không tính thêm phí nền tảng cho các lần suy luận (inference) và phản ánh chính xác giá của nhà cung cấp, kể cả đối với các yêu cầu Sử Dụng Khóa Riêng (BYOK - Bring Your Own Key). Điều này cho thấy Vercel muốn cung cấp một giải pháp minh bạch và tiết kiệm chi phí cho người dùng. 💰

Các nhà phát triển quan tâm có thể thử nghiệm GLM 5.2 Fast ngay tại model playground của Vercel AI Gateway. Đây là một bước tiến quan trọng trong việc tối ưu hóa hiệu suất và khả năng tiếp cận các mô hình AI tiên tiến cho cộng đồng.