NVIDIA Cosmos 3 đã chính thức soán ngôi vị dẫn đầu trên bảng xếp hạng Artificial Analysis dành cho các mô hình mã nguồn mở (open weights). Cụ thể, mô hình này đứng đầu ở cả hai mảng quan trọng là tạo hình ảnh từ văn bản (Text-to-Image) và tạo video từ hình ảnh (Image-to-Video).
Cosmos 3 không chỉ dừng lại ở việc tạo nội dung số mà được thiết kế như một dòng "Omnimodal World Models" phục vụ cho Physical AI. Điểm đột phá của nó nằm ở khả năng hợp nhất nhiều loại dữ liệu bao gồm ngôn ngữ, hình ảnh, video, âm thanh và cả các chuỗi hành động vào trong một kiến trúc duy nhất. Điều này hứa hẹn sẽ mở ra những bước tiến mới cho robotics và các hệ thống AI tương tác với thế giới thực.