Google DeepMind vừa công bố một bước tiến mới trong việc phát triển trí tuệ nhân tạo thế giới (world models) bằng cách tích hợp dữ liệu hình ảnh từ Street View vào Project Genie. Sự kết hợp này cho phép người dùng giả lập và "chơi" trong các môi trường ảo được tái hiện từ những địa điểm thực tế trên toàn cầu.
Diễn biến
Project Genie là một mô hình AI có khả năng sinh ra các môi trường 2D có tính tương tác từ hình ảnh hoặc mô tả văn bản. Bằng cách tận dụng kho dữ liệu khổng lồ của Street View, DeepMind đã huấn luyện hệ thống để hiểu các quy luật không gian và động lực học của thế giới thực. Giờ đây, người dùng đăng ký gói Google AI Ultra có thể chuyển đổi các bức ảnh toàn cảnh (panoramic images) thành các không gian ảo có thể di chuyển và tương tác, duy trì được độ trung thực về hình ảnh và vật lý.
Vì sao đáng chú ý
Đây là minh chứng cho thấy AI đang dần chuyển từ việc chỉ hiểu hình ảnh sang việc mô phỏng lại toàn bộ trải nghiệm thực tế. Đối với giới công nghệ Việt Nam, công nghệ này mở ra tiềm năng lớn trong việc phát triển game, huấn luyện robot trong môi trường mô phỏng (Sim-to-Real) hoặc xây dựng các bản đồ số 3D thế hệ mới. Việc kết hợp dữ liệu quy mô lớn như Street View giúp giải quyết bài toán thiếu hụt dữ liệu môi trường cho các hệ thống AI vật lý.