Bỏ qua đến nội dung chính
Về trang chủ
Tech 2 phút đọc

ChatGPT hỗ trợ điền biểu mẫu tự động từ ảnh chụp và giọng nói 📝

OpenAI cập nhật tính năng mới giúp ChatGPT tự động điền các loại biểu mẫu thông qua hình ảnh tải lên, kết hợp cùng chỉ dẫn bằng văn bản hoặc giọng nói, giúp tối ưu hóa việc xử lý giấy tờ.

Tier 2 · nguồn 95% độ tin cậy Đã được duyệt
📚 Tổng hợp từ 2 nguồn X — @ChatGPTapp X — @ChatGPTapp

OpenAI đã chính thức giới thiệu khả năng điền biểu mẫu (form filling) tự động cho ChatGPT, một bước tiến quan trọng trong việc ứng dụng AI vào các tác vụ xử lý giấy tờ hàng ngày. Người dùng hiện có thể tải lên ảnh chụp của bất kỳ biểu mẫu nào, sau đó yêu cầu ChatGPT hoàn thiện thông tin dựa trên dữ liệu cung cấp.

Diễn biến

Tính năng mới này tận dụng tối đa khả năng đa phương thức (multimodal) của các mô hình ngôn ngữ lớn mới nhất. Theo OpenAI, quy trình này có thể thực hiện theo hai cách linh hoạt. Thứ nhất, người dùng tải ảnh form lên và nhập các thông tin chi tiết bằng văn bản để AI tự động sắp xếp vào đúng vị trí.

Thứ hai, ChatGPT cho phép người dùng "nói chuyện" trực tiếp thông qua Voice Mode để điền form. "Giấy tờ sẽ tốt hơn khi bạn có thể vừa nói vừa xử lý chúng," OpenAI chia sẻ trên mạng xã hội X. Với sự kết hợp giữa thị giác máy tính và giọng nói, ChatGPT có thể nhận diện các ô trống, tiêu đề mục và định dạng của biểu mẫu để trả về một phiên bản hoàn chỉnh. Điều này giúp giảm thiểu đáng kể sự mệt mỏi khi phải đối mặt với các tệp hồ sơ dài hoặc các loại đơn từ phức tạp.

Vì sao đáng chú ý

Đây không chỉ là một công cụ tiện ích đơn thuần mà còn là minh chứng cho thấy ChatGPT đang dần trở thành một "tác nhân" (agent) có khả năng tương tác mạnh mẽ với thế giới vật lý thông qua hình ảnh. Đối với người dùng Việt Nam, tính năng này cực kỳ hữu ích trong việc xử lý các loại hóa đơn, đơn từ hoặc các tờ khai hành chính vốn vẫn chiếm tỷ trọng lớn trong đời sống thường ngày.

Thay vì phải gõ lại từng dòng thông tin từ ảnh chụp vào máy tính, người dùng chỉ cần ra lệnh. Tuy nhiên, giới chuyên gia cũng lưu ý người dùng cần cẩn trọng khi chia sẻ các hình ảnh chứa thông tin cá nhân nhạy cảm lên AI. Khả năng bảo mật dữ liệu và độ chính xác trong việc trích xuất thông tin trên các mẫu form có ngôn ngữ hoặc cấu trúc đặc thù sẽ cần được kiểm chứng thêm qua thực tế sử dụng.