Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 3 phút đọc

Nhà nghiên cứu nhận giải thưởng IEEE đào tạo robot tự đưa ra phán đoán bằng Diff-DAgger 🤖

Yen-Ling Kuo, giáo sư tại Đại học Virginia, nhận giải thưởng đột phá của IEEE nhờ phát triển Diff-DAgger – phương pháp giúp robot tự ước lượng độ bất định và đưa ra phán đoán chính xác trong các tình huống chưa từng được huấn luyện.

Tier 2 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc spectrum.ieee.org

Việc huấn luyện robot hoạt động trơn tru trong thế giới thực luôn là một thách thức lớn đối với các kỹ sư và nhà nghiên cứu AI. Thông thường, khi đối mặt với một tình huống nằm ngoài tập dữ liệu huấn luyện, robot sẽ dễ dàng bị đơ hoặc thực hiện sai lệch hành vi.

Để giải quyết triệt để bài toán này, Yen-Ling Kuo – Trợ lý Giáo sư Khoa Khoa học Máy tính tại Đại học Virginia (UVA) – đã phát triển một phương pháp tiếp cận đột phá mang tên Diff-DAgger. Nghiên cứu xuất sắc này đã giúp cô nhận được giải thưởng danh giá Early Career Contribution Award từ Hiệp hội Robot và Tự động hóa của IEEE (IEEE Robotics and Automation Society).

---

Diff-DAgger: Ước lượng độ bất định bằng Diffusion Policy

Nghiên cứu của giáo sư Kuo mang tiêu đề đầy đủ là "Diff-DAgger: Uncertainty Estimation with Diffusion Policy for Robotic Manipulation". Đây là một kỹ thuật mới giúp robot cải thiện đáng kể khả năng tự nhận diện và đánh giá "độ bất định" (uncertainty) khi gặp phải các tình huống mà chúng chưa từng được huấn luyện trực tiếp.

#### Các đặc điểm và ưu điểm nổi bật của phương pháp này bao gồm:

1. Kết hợp mô hình khuếch tán (Diffusion Policy): Diffusion Policy là một trong những mô hình mạnh mẽ nhất hiện nay trong việc điều khiển robot thực hiện các hành vi khéo léo và mượt mà. Diff-DAgger tích hợp kỹ thuật ước lượng độ bất định trực tiếp vào mô hình này. 2. Giảm thiểu sự giám sát của con người: Khi robot gặp phải các vật thể lạ hoặc góc quay chưa từng thấy, thay vì liên tục dừng lại chờ con người hướng dẫn từ đầu đến cuối, Diff-DAgger giúp robot tự ước lượng mức độ tự tin của hành vi. Robot sẽ chỉ yêu cầu con người can thiệp tối thiểu tại những thời điểm có độ bất định cao nhất. 3. Nâng cao tỷ lệ thành công: Việc tự đưa ra các "phán đoán có cơ sở" giúp robot tiếp tục thực hiện tác vụ thay vì đổ vỡ giữa chừng. Thử nghiệm thực tế cho thấy tỷ lệ hoàn thành công việc tăng lên rõ rệt. 4. Mở đường cho các mô hình AI lớn hơn: Phương pháp này giúp quá trình thu thập dữ liệu tương tác giữa người và robot trở nên hiệu quả hơn nhiều, tạo tiền đề để đưa các mô hình AI khổng lồ và phức tạp vào vận hành các cánh tay robot hoặc robot di động thực tế.

---

Ý nghĩa thực tiễn đối với tương lai của ngành Robotics

Bản thân Yen-Ling Kuo có một hành trình đầy cảm hứng từ khi còn là một học sinh tại Đài Loan, bắt đầu làm quen với lập trình qua phần mềm giáo dục Logo, cho tới khi làm việc tại Google ở Thung lũng Silicon và sau đó tốt nghiệp Tiến sĩ tại MIT Media Lab.

Sự giao thoa giữa khoa học nhận thức và khoa học máy tính là kim chỉ nam giúp cô phát triển các thuật toán điều khiển robot tự nhiên hơn. Nghiên cứu của cô giải quyết một trong những "nút thắt cổ chai" lớn nhất hiện nay của robot thông minh: làm sao để robot học hỏi từ thế giới xung quanh một cách an toàn và liên tục.

Với Diff-DAgger, các hệ thống tự động hóa trong kho bãi, nhà máy và thậm chí là robot hỗ trợ gia đình sẽ trở nên độc lập hơn, thông minh hơn và ít phụ thuộc vào sự điều khiển thủ công của con người.