Yann LeCun, nhà khoa học trưởng về AI tại Meta, vừa đưa ra dự báo rằng trong khoảng 12 đến 18 tháng tới, chúng ta sẽ có một phương pháp tổng quát để huấn luyện các mô hình thế giới phân tầng (hierarchical world models).
Diễn biến
Theo Yann LeCun, các mô hình này sẽ không chỉ học từ văn bản như các LLM hiện nay mà sẽ học trực tiếp từ video và dữ liệu thế giới thực. Khác biệt cốt lõi nằm ở khả năng hiểu quy luật vật lý và quan hệ nhân quả. Khi có được mô hình thế giới, AI có thể dự đoán kết quả của các hành động và từ đó lập kế hoạch (planning) để đạt được mục tiêu cụ thể.
Công nghệ này được kỳ vọng sẽ ứng dụng mạnh mẽ trong lĩnh vực Robotics, nơi máy móc cần tương tác với môi trường vật lý, cũng như trong Y tế và các lĩnh vực đòi hỏi khả năng ra quyết định dựa trên bối cảnh phức tạp.
Vì sao đáng chú ý
Dự báo của LeCun đánh dấu một bước chuyển dịch quan trọng từ AI thuần ngôn ngữ sang AI có tri thức về thế giới thực (World Models). Đối với cộng đồng công nghệ Việt Nam, đây là tín hiệu để tập trung vào các nghiên cứu kết hợp giữa AI và Robotics (Embodied AI). Nếu thành công, đây sẽ là lời giải cho bài toán AI thiếu tính logic và khả năng lập kế hoạch mà các mô hình GPT hiện tại đang gặp phải.