Bỏ qua đến nội dung chính
Về trang chủ
tools-ai Tech 1 phút đọc

NVIDIA Ra Mắt Nền Tảng Vera Rubin: Kỷ Nguyên Tác Nhân AI Nghìn Tỷ Tham Số

NVIDIA giới thiệu nền tảng Vera Rubin mới, tối ưu hóa cho các tác vụ agentic trên các mô hình AI khổng lồ, hứa hẹn hiệu suất vượt trội mà không làm tăng độ trễ.

Tier 1 · nguồn 99% độ tin cậy Đã được duyệt
Nguồn gốc x.com

Tác nhân AI nghìn tỷ tham số

NVIDIA đã công bố nền tảng Vera Rubin, giải pháp phần cứng mới nhất hướng tới việc phục vụ các tác vụ tác nhân (agentic workloads) trên các mô hình AI có quy mô lên tới hàng nghàn tỷ tham số. Mục tiêu là đạt hiệu suất 400 token/giây cho mỗi người dùng.

Cấu hình Vera Rubin NVL72

Nền tảng này là sự kết hợp giữa Vera Rubin NVL72 và NVIDIA Groq 3 LPX, được thiết kế đặc biệt để xử lý các mô hình Mixture of Experts (MoE) khổng lồ với độ trễ cực thấp.

Tầm quan trọng

Việc duy trì tốc độ cao và độ trễ thấp trên các mô hình nghìn tỷ tham số là yếu tố then chốt để hiện thực hóa các AI Agent phức tạp trong tương lai, từ trợ lý ảo thông minh đến hệ thống tự động hóa doanh nghiệp.

Nguồn tin

- NVIDIA Official

Đã đọc hết tin tools-ai hiện có.