OpenAI đã chính thức giới thiệu khả năng điền biểu mẫu (form filling) tự động cho ChatGPT, một bước tiến quan trọng trong việc ứng dụng AI vào các tác vụ xử lý giấy tờ hàng ngày. Người dùng hiện có thể tải lên ảnh chụp của bất kỳ biểu mẫu nào, sau đó yêu cầu ChatGPT hoàn thiện thông tin dựa trên dữ liệu cung cấp.
Diễn biến
Tính năng mới này tận dụng tối đa khả năng đa phương thức (multimodal) của các mô hình ngôn ngữ lớn mới nhất. Theo OpenAI, quy trình này có thể thực hiện theo hai cách linh hoạt. Thứ nhất, người dùng tải ảnh form lên và nhập các thông tin chi tiết bằng văn bản để AI tự động sắp xếp vào đúng vị trí.
Thứ hai, ChatGPT cho phép người dùng "nói chuyện" trực tiếp thông qua Voice Mode để điền form. "Giấy tờ sẽ tốt hơn khi bạn có thể vừa nói vừa xử lý chúng," OpenAI chia sẻ trên mạng xã hội X. Với sự kết hợp giữa thị giác máy tính và giọng nói, ChatGPT có thể nhận diện các ô trống, tiêu đề mục và định dạng của biểu mẫu để trả về một phiên bản hoàn chỉnh. Điều này giúp giảm thiểu đáng kể sự mệt mỏi khi phải đối mặt với các tệp hồ sơ dài hoặc các loại đơn từ phức tạp.
Vì sao đáng chú ý
Đây không chỉ là một công cụ tiện ích đơn thuần mà còn là minh chứng cho thấy ChatGPT đang dần trở thành một "tác nhân" (agent) có khả năng tương tác mạnh mẽ với thế giới vật lý thông qua hình ảnh. Đối với người dùng Việt Nam, tính năng này cực kỳ hữu ích trong việc xử lý các loại hóa đơn, đơn từ hoặc các tờ khai hành chính vốn vẫn chiếm tỷ trọng lớn trong đời sống thường ngày.
Thay vì phải gõ lại từng dòng thông tin từ ảnh chụp vào máy tính, người dùng chỉ cần ra lệnh. Tuy nhiên, giới chuyên gia cũng lưu ý người dùng cần cẩn trọng khi chia sẻ các hình ảnh chứa thông tin cá nhân nhạy cảm lên AI. Khả năng bảo mật dữ liệu và độ chính xác trong việc trích xuất thông tin trên các mẫu form có ngôn ngữ hoặc cấu trúc đặc thù sẽ cần được kiểm chứng thêm qua thực tế sử dụng.