Bỏ qua đến nội dung chính
Về trang chủ
Robotics AI tools-ai 5 phút đọc

NVIDIA ENPIRE: Đặc Vụ AI Tự Điều Khiển Robot, Đạt Tỷ Lệ Thành Công 99%! 🤖✨

Khuôn khổ ENPIRE mới của NVIDIA, hợp tác với Đại học Carnegie Mellon và UC Berkeley, cho phép các đặc vụ mã hóa AI tự động huấn luyện, đánh giá và cải thiện robot vật lý mà không cần can thiệp liên tục từ con người, đạt tỷ lệ thành công ấn tượng 99% trong các tác vụ thao tác chính xác.

Tier 2 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc arstechnica.com

Phòng thí nghiệm GEAR (Generalist Embodied Agent Research) của NVIDIA, với sự hợp tác của Đại học Carnegie MellonUC Berkeley, đã phát triển ENPIRE – một khuôn khổ vòng lặp kín đột phá. ENPIRE cho phép các đặc vụ mã hóa AI tự chủ đào tạo, đánh giá và cải thiện robot vật lý mà không cần sự can thiệp liên tục của con người.

Trong các thử nghiệm, hệ thống này đã đạt tỷ lệ thành công ấn tượng 99% (tỷ lệ pass@8) trong các tác vụ thao tác vật lý đòi hỏi độ chính xác cao, như cắt dây rút, lắp GPU vào khe cắm bo mạch chủ mỏng, và sắp xếp ghim vào hộp (PushT).

ENPIRE là gì? 🧠

ENPIRE là viết tắt của Environment, Policy Improvement, Rollout, Evolution (Môi trường, Cải tiến Chính sách, Triển khai, Tiến hóa). Nó hoạt động thông qua bốn mô-đun riêng biệt, nhưng được kết nối chặt chẽ:

* Environment (EN): Xử lý việc đặt lại tự động và xác minh trạng thái vật lý. Nếu một robot thất bại trong nhiệm vụ, mô-đun này sẽ đặt lại môi trường vật lý (ví dụ: sử dụng một cánh tay robot riêng biệt hoặc bộ truyền động cơ học) để robot có thể thử lại mà không cần sự can thiệp của con người. * Policy Improvement (PI): Khởi động quá trình tinh chỉnh chính sách, đề xuất các giả thuyết thuật toán (như học heuristic, nhân bản hành vi, học tăng cường ngoại tuyến và trực tuyến), phân tích dữ liệu hiệu suất và điều chỉnh trực tiếp mã hành vi của robot. * Rollout (R): Quản lý các đánh giá vật lý song song trên nhiều robot cùng lúc. Nó đánh giá các chính sách với một hoặc nhiều robot vật lý hoạt động song song. * Evolution (E): Là lớp tinh chỉnh mã do tác nhân điều khiển, nơi các đặc vụ mã hóa phân tích nhật ký, tham khảo tài liệu, cải thiện cơ sở hạ tầng đào tạo và sửa đổi mã thuật toán để khắc phục các chế độ lỗi.

Hệ thống vòng lặp kín này biến việc học robot trong thế giới thực thành một quy trình tối ưu hóa có thể kiểm soát, do các tác nhân quản lý. Điều này giúp giảm thiểu nỗ lực của con người trong khi vẫn cho phép các phép loại bỏ công bằng trên các công thức đào tạo và biến thể tác nhân.

Chi tiết Kỹ thuật & Số liệu Chính 🛠️

* Thiết lập phần cứng: 8 robot hai tay thực hiện triển khai chính sách song song. * Đặc vụ mã hóa AI được sử dụng: Các tác nhân mã hóa tiên tiến như Codex (qua GPT-5.5), Claude Code và Kimi Code. * Các số liệu tối ưu hóa cốt lõi: * Mean Robot Utilization (MRU): Đo lường công việc hữu ích được tạo ra bởi mỗi robot. * Mean Token Utilization (MTU): Đo lường công việc hữu ích được tạo ra trên mỗi token AI. * Giải thích về số liệu "pass@8": Đây không phải là việc lấy mẫu độc lập tốt nhất trong 8 lần. Trong một lần triển khai dài hạn duy nhất, vòng lặp tác nhân được phép thử lại tối đa 8 lần trong ngữ cảnh cho mỗi tác vụ phụ, mỗi lần thử lại đều dựa trên các thất bại trước đó. Nó đo lường khả năng thử lại và phục hồi đột phá của các robot vật lý, chứ không phải chỉ là may mắn khi lấy mẫu. Đạt tỷ lệ thành công 99% trên các lần thử lại này là một minh chứng cho khả năng vượt trội của hệ thống.

Tác động Thị trường & Công nghiệp 🌍

* Phòng thí nghiệm Robot Tự hành: Jim Fan, giám đốc AI và đồng trưởng phòng thí nghiệm GEAR của NVIDIA, nhấn mạnh rằng một phần công việc nghiên cứu giờ đây có thể được tự động hóa hoàn toàn. Các nhà nghiên cứu chủ yếu xem xét kết quả mà các đặc vụ AI đã tạo ra qua đêm. * Yếu tố đột phá nguồn mở: NVIDIA đã công bố rằng khuôn khổ ENPIRE sẽ được cung cấp dưới dạng nguồn mở, giảm rào cản gia nhập cho các trường đại học, công ty và những người có sở thích để thiết lập các phòng thí nghiệm robot tự lái tương tự. Đây là một tin tốt, mở ra cơ hội lớn cho cộng đồng nghiên cứu và phát triển robot. * Tích hợp Hệ sinh thái NVIDIA: Điều đáng chú ý là mọi robot trong thiết lập ENPIRE đều chạy trên phần cứng của NVIDIA, sử dụng ngăn xếp phần mềm của NVIDIA và xử lý dữ liệu thông qua cơ sở hạ tầng tính toán của NVIDIA. Điều này không chỉ khẳng định vị thế của NVIDIA mà còn tạo ra một "khóa" hệ sinh thái mạnh mẽ, khiến người dùng càng phụ thuộc vào các giải pháp của hãng.