Thay vì chỉ theo dõi vị trí nhấn, AI giúp con trỏ chuột hiểu được 'nội dung' mà người dùng đang trỏ vào, mở ra khả năng tương tác trực tiếp với thông tin trong hình ảnh và video.
Diễn biến
Google DeepMind mô tả tầm nhìn nơi một bức ảnh chụp ghi chú nguệch ngoạc có thể biến ngay thành danh sách to-do list tương tác, hoặc một khung hình video đang tạm dừng có thể trở thành link đặt bàn nhà hàng chỉ bằng một cú trỏ chuột. AI đóng vai trò nhận diện thực thể và ngữ cảnh tại vị trí con trỏ để đưa ra gợi ý hành động phù hợp.
Vì sao đáng chú ý
Công nghệ này giúp xóa nhòa ranh giới giữa dữ liệu tĩnh (hình ảnh, video) và dữ liệu có thể xử lý được. Đối với người dùng văn phòng hoặc sáng tạo nội dung, khả năng 'trích xuất ý nghĩa' ngay lập tức từ màn hình sẽ giúp tăng đáng kể năng suất lao động và giảm thiểu các bước nhập liệu thủ công.