NVIDIA Research vừa chính thức công bố MotionBricks tại hội nghị SIGGRAPH 2026. Đây là một mô hình sinh chuyển động (motion generation model) nguồn mở mang tính đột phá, giải quyết triệt để bài toán kiểm soát chuyển động thời gian thực (real-time interactive motion control) vốn lâu nay vẫn bị thống trị bởi các phương pháp thủ công truyền thống.
Với khả năng đạt tốc độ xử lý lên tới 15.000 FPS và độ trễ cực thấp chỉ 2ms, MotionBricks là bước tiến lớn giúp thu hẹp khoảng cách giữa các nghiên cứu học thuật về AI sinh tạo và quy trình sản xuất thực tế trong hai lĩnh vực: hoạt họa game cao cấp và điều khiển robot thông minh.
---
Những điểm cốt lõi tạo nên sự vượt trội của MotionBricks
Các phương pháp sinh chuyển động bằng AI trước đây thường gặp hai rào cản lớn khi đưa vào sản xuất thực tế: 1. Khả năng mở rộng thời gian thực (Real-time scalability): Các mô hình sinh tạo thường suy giảm chất lượng hoạt họa hoặc tiêu tốn quá nhiều tài nguyên tính toán khi chạy thời gian thực. 2. Khả năng tích hợp điều khiển (Integration): Các ứng dụng thực tế đòi hỏi khả năng điều khiển đa phương thức chi tiết (như vận tốc, phong cách chuyển động, hoặc các khía cạnh định vị cụ thể), điều mà các mô hình điều khiển bằng văn bản (text-to-motion) thông thường không đáp ứng được.
MotionBricks giải quyết các vấn đề này thông qua kiến trúc độc đáo: * Mạng xương sống ẩn hợp nhất (Unified Latent Neural Backbone): Toàn bộ các chuyển động phức tạp từ đi bộ, chạy, nhào lộn đến tương tác với đồ vật đều được sinh ra từ một mô hình duy nhất mà không cần các bước nối chuyển tiếp (blending) thủ công hay xử lý khóa bàn chân (foot-locking) để tránh trượt chân. * Giao diện khối dựng thông minh (Smart Primitives Interface): Giúp lập trình viên có thể lắp ráp các khối chuyển động một cách trực quan giống như chơi Lego ("bricks"), loại bỏ hoàn toàn yêu cầu phải có chuyên gia hoạt họa can thiệp sâu. * Bộ dữ liệu huấn luyện khổng lồ: Mô hình được huấn luyện trên bộ dữ liệu BONES-SEED do bones-studio cung cấp, chứa hơn 350.000 clip bắt chuyển động (mocap) chất lượng cao từ các diễn viên thực tế.
---
Hiệu năng thực chiến: 15.000 FPS và 2ms độ trễ
Về mặt định lượng, MotionBricks thiết lập một tiêu chuẩn hiệu năng mới chưa từng có: * Tốc độ xử lý: Đạt 15.000 khung hình trên giây (FPS) trên phần cứng NVIDIA hiện đại. * Độ trễ: Chỉ 2ms, cho phép phản hồi tức thì với các thao tác của người chơi hoặc cảm biến của robot.
Để chứng minh tính thực tiễn, NVIDIA đã phát hành một bản demo không cắt (uncut) dài 2 phút 40 giây chạy trực tiếp trên Unreal Engine 5 (UE5). Bản demo thể hiện khả năng di chuyển linh hoạt, vượt chướng ngại vật và tương tác môi trường cực kỳ mượt mà. Mọi hành động của nhân vật đều được sinh ra hoàn toàn từ mạng thần kinh — không hề có sự can thiệp của các kỹ thuật dựng hình truyền thống hay xử lý va chạm thủ công.
---
Ứng dụng thực tế trên Robot bionic Unitree G1
Không chỉ dừng lại ở hoạt họa kỹ thuật số, NVIDIA Research đã triển khai trực tiếp MotionBricks lên robot nhân dạng Unitree G1 để thực hiện kiểm soát toàn thân (whole-body control) trong thời gian thực.
Nhờ khả năng tổng quát hóa mạnh mẽ, robot Unitree G1 có thể thực hiện các chuyển động linh hoạt dựa trên các lệnh điều khiển thời gian thực mà không cần tinh chỉnh (fine-tuning) hay dán nhãn tác vụ cụ thể. Đây là minh chứng rõ ràng cho thấy tiềm năng của MotionBricks trong việc định hình tương lai của Robot vật lý trí tuệ nhân tạo (Physical AI).
---
Thông tin mã nguồn và tài nguyên dự án
Hiện tại, NVIDIA Research đã công bố đầy đủ bài báo khoa học, các bản demo trực quan và mã nguồn của dự án để cộng đồng nhà phát triển có thể tiếp cận: * Trang chủ dự án: NVIDIA Labs - MotionBricks * Mã nguồn: Được tích hợp trong kho lưu trữ GR00T Whole-Body Control của NVIDIA tại GitHub - NVlabs/GR00T-WholeBodyControl * Bộ dữ liệu huấn luyện: BONES-SEED Dataset on Hugging Face