Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 4 phút đọc

NVIDIA ra mắt Vera CPU: 'Bộ não' chuyên dụng cho Kỷ nguyên AI Tác nhân – Bước ngoặt hay chỉ là chiêu trò? 🤔

NVIDIA vừa chính thức giới thiệu Vera CPU, bộ vi xử lý đầu tiên trên thế giới được thiết kế chuyên biệt cho AI tác nhân và học tăng cường, nhằm loại bỏ các nút thắt cổ chai của CPU truyền thống và tối ưu hiệu suất GPU.

Tier 1 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc nvidianews.nvidia.com

NVIDIA Ra Mắt Vera CPU: 'Bộ Não' Chuyên Dụng Cho Kỷ Nguyên AI Tác Nhân 🚀

NVIDIA vừa gây chú ý lớn trong giới công nghệ khi chính thức công bố Vera CPU, bộ vi xử lý đầu tiên trên thế giới được thiết kế chuyên biệt cho kỷ nguyên AI tác nhân (Agentic AI) và học tăng cường. Con chip này được kỳ vọng sẽ giải quyết triệt để các nút thắt cổ chai của CPU truyền thống thường gặp trong quá trình suy luận, lập kế hoạch, điều phối tác vụ và thực thi công cụ của AI tác nhân, từ đó giúp các GPU đạt được hiệu suất tối đa. Liệu đây có phải là mảnh ghép còn thiếu để khai phá toàn bộ tiềm năng của AI tác nhân? 🧐

Các Tính Năng Nổi Bật và Kiến Trúc Độc Đáo ✨

Vera CPU sở hữu một kiến trúc được tối ưu hóa đặc biệt, khác biệt hoàn toàn so với các CPU đa năng hiện có:

* 88 Lõi Olympus Tùy Chỉnh: Vera được trang bị 88 lõi Olympus do NVIDIA tự thiết kế, xây dựng trên một hệ thống bộ nhớ băng thông cao, hứa hẹn khả năng xử lý mạnh mẽ. * Đa Luồng Không Gian (Spatial Multithreading): Mỗi lõi có thể xử lý đồng thời hai tác vụ, mang lại hiệu suất ổn định và thông lượng cao, đặc biệt lý tưởng cho các khối lượng công việc AI đa người thuê. * Băng Thông Cực Đại: Hệ thống bộ nhớ LPDDR5X của Vera cung cấp băng thông lên tới 1.2TB/s, nhanh hơn tới 1.8 lần so với các CPU x86 truyền thống trên quy mô rack. Điều này giúp đẩy nhanh tốc độ truyền dữ liệu, giảm thời gian chờ đợi cho GPU. * Hỗ Trợ FP8 ISA Đầu Tiên: Vera là CPU đa năng đầu tiên hỗ trợ định dạng số FP8 trong kiến trúc tập lệnh (ISA). Đây là một tính năng quan trọng cho các tác vụ AI phía máy chủ (host-side AI) như nhúng lượng tử hóa (quantized embeddings) và các bộ lọc chính sách nhẹ (lightweight policy filters). * Thiết Kế Để Xóa Bỏ 'Nút Thắt Tác Nhân': Các quy trình làm việc của AI tác nhân hiện đại thường bao gồm các vòng lặp suy luận, thực thi mã Python trong môi trường sandbox, sử dụng công cụ và truy vấn cơ sở dữ liệu. Các CPU truyền thống thường gặp khó khăn với những bước tuần tự này, dẫn đến tình trạng GPU bị nhàn rỗi. Vera được tạo ra để loại bỏ hoàn toàn “nút thắt tác nhân” này, đảm bảo GPU luôn hoạt động hết công suất.

Đối Tác và Kế Hoạch Triển Khai 🤝

NVIDIA đã bắt đầu vận chuyển những lô Vera CPU đầu tiên đến các phòng thí nghiệm AI hàng đầu thế giới, cho thấy mức độ sẵn sàng của sản phẩm:

* Anthropic, OpenAISpaceXAI đã là những đơn vị tiên phong nhận được bộ vi xử lý này. * Oracle Cloud Infrastructure (OCI) trở thành nhà cung cấp đám mây đầu tiên triển khai Vera ở quy mô siêu lớn, với kế hoạch lắp đặt hàng trăm nghìn Vera CPU bắt đầu từ năm 2026. * Các hệ thống sử dụng Vera cũng đang được tích hợp bởi các nhà sản xuất hàng đầu như Dell Technologies, HPE, Lenovo và Supermicro.

Jensen Huang, nhà sáng lập và CEO của NVIDIA, chia sẻ: "Các tác nhân AI sẽ là những người sử dụng điện toán lớn nhất. Vera là CPU đầu tiên được thiết kế cho tương lai đó — được xây dựng để chạy AI tác nhân ở quy mô siêu lớn với hiệu suất, hiệu quả và khả năng lập trình phi thường."

Lời bình từ Kalera News: Sự ra đời của Vera CPU cho thấy NVIDIA không chỉ dừng lại ở GPU mà còn đang mở rộng tầm ảnh hưởng sâu rộng vào các thành phần cốt lõi khác của hệ sinh thái AI. Việc tập trung giải quyết các nút thắt cổ chai chuyên biệt cho AI tác nhân là một bước đi chiến lược, nhưng liệu Vera có thực sự trở thành tiêu chuẩn mới hay chỉ là một giải pháp cao cấp cho một số ít ứng dụng siêu quy mô? Chúng ta cần thêm thời gian để đánh giá tác động thực sự của nó trên thị trường. 📉📈