Bỏ qua đến nội dung chính
Về trang chủ
AI 1 phút đọc

NVIDIA Cosmos 3 dẫn đầu bảng xếp hạng Artificial Analysis cho mô hình mã nguồn mở

Mô hình Cosmos 3 của NVIDIA vừa đạt vị trí số 1 trong cả hai hạng mục Text-to-Image và Image-to-Video trên bảng xếp hạng Artificial Analysis. Đây là dòng mô hình "Physical AI" đa phương thức, hợp nhất ngôn ngữ, hình ảnh, video, âm thanh và hành động.

Tier 1 · nguồn 81% độ tin cậy Đã được duyệt
Nguồn gốc x.com

NVIDIA Cosmos 3 đã chính thức soán ngôi vị dẫn đầu trên bảng xếp hạng Artificial Analysis dành cho các mô hình mã nguồn mở (open weights). Cụ thể, mô hình này đứng đầu ở cả hai mảng quan trọng là tạo hình ảnh từ văn bản (Text-to-Image) và tạo video từ hình ảnh (Image-to-Video).

Cosmos 3 không chỉ dừng lại ở việc tạo nội dung số mà được thiết kế như một dòng "Omnimodal World Models" phục vụ cho Physical AI. Điểm đột phá của nó nằm ở khả năng hợp nhất nhiều loại dữ liệu bao gồm ngôn ngữ, hình ảnh, video, âm thanh và cả các chuỗi hành động vào trong một kiến trúc duy nhất. Điều này hứa hẹn sẽ mở ra những bước tiến mới cho robotics và các hệ thống AI tương tác với thế giới thực.