AI tools-ai 3 thg 7, 2026 5 phút đọc

Cloudflare "Phong Tỏa" Bot AI "Hỗn Hợp": Nhà Xuất Bản Sẽ Được Trả Tiền? 💸🤖

Cloudflare vừa công bố chính sách mới yêu cầu các công ty AI phải tách biệt bot tìm kiếm truyền thống khỏi bot dùng để huấn luyện AI trước ngày 15 tháng 9 năm 2026, nếu không sẽ bị chặn, nhằm bảo vệ nội dung của nhà xuất bản và mở ra cơ hội kiếm tiền mới.

Tier 1 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc engadget.com

Cloudflare Yêu Cầu Các Công Ty AI Trả Tiền Cho Nội Dung Của Nhà Xuất Bản

Nguồn: TechCrunch Tác giả: Sarah Perez Ngày: 1 tháng 7 năm 2026

---

Tóm Tắt Điều Hành

Cloudflare đã công bố một sự thay đổi chính sách lớn nhằm bảo vệ tài sản trí tuệ của nhà xuất bản khỏi việc huấn luyện AI trái phép. Công ty yêu cầu các hãng AI phải tách biệt các trình thu thập thông tin tìm kiếm truyền thống khỏi những trình được dùng cho việc huấn luyện và các tác nhân AI trước ngày 15 tháng 9 năm 2026. Nếu không tuân thủ, các trình thu thập thông tin "hỗn hợp" này sẽ bị chặn mặc định trên các trang web của nhà xuất bản có quảng cáo.

---

Chi Tiết Chính Sách & Thời Hạn Quan Trọng

* Thời hạn: 15 tháng 9 năm 2026. * Hành động: Cài đặt mặc định của Cloudflare sẽ chặn các trình thu thập thông tin "hỗn hợp" (bot kết hợp lập chỉ mục tìm kiếm, sử dụng tác nhân AI và huấn luyện AI) truy cập vào bất kỳ trang nào chứa quảng cáo. * Đối tượng bị ảnh hưởng: * Tất cả khách hàng Cloudflare mới. * Các trang web mới được thiết lập bởi khách hàng hiện tại. * Tất cả khách hàng hiện tại sử dụng gói miễn phí. * Lưu ý: Chủ sở hữu trang web có thể tự điều chỉnh cài đặt để bỏ chặn nếu muốn.

---

Mâu Thuẫn Giữa 'Tìm Kiếm' và 'Huấn Luyện AI'

Các nhà xuất bản đối mặt với tình thế tiến thoái lưỡng nan: họ muốn nội dung của mình được tìm thấy qua các công cụ tìm kiếm truyền thống, nhưng lại không muốn tài sản trí tuệ của họ bị 'cào' miễn phí để huấn luyện các mô hình AI.

* Thế khó của Google: Cloudflare đã thẳng thắn nhắc đến Google ("công cụ tìm kiếm lớn nhất thế giới") khi cho rằng Google có quyền truy cập "gấp đôi thông tin" so với các đối thủ vì trong lịch sử đã gộp việc lập chỉ mục tìm kiếm với huấn luyện AI. * Lập trường của Google: Google phủ nhận sự khái quát hóa này, viện dẫn bot Google Extended của họ, cho phép nhà xuất bản từ chối việc sử dụng nội dung để huấn luyện các ứng dụng Gemini và Vertex API mà không ảnh hưởng đến thứ hạng tìm kiếm trên Google Search. Tuy nhiên, bot chính của Google là Googlebot vẫn thu thập thông tin cho cả Search và các tính năng do AI điều khiển như AI Overviews và AI Mode. * Cột mốc lưu lượng bot: CEO Cloudflare Matthew Prince lưu ý rằng lưu lượng truy cập của bot phi con người đã chính thức vượt qua lưu lượng truy cập của con người trên internet, sớm hơn so với dự báo trước đây của ngành.

> “Giờ đây, khi phần lớn lưu lượng truy cập trên Internet là phi con người, chúng ta phải đi xa hơn và hành động nhanh hơn để một hệ sinh thái bền vững có thể hình thành... Các công cụ và quan hệ đối tác mới của Cloudflare mang lại cho chủ sở hữu trang web khả năng hiển thị và cơ hội thương mại cao hơn, đồng thời mang lại lợi ích cho các công ty AI có bot với mục đích rõ ràng và minh bạch. Chúng tôi hy vọng rằng những thay đổi mặc định đề xuất của chúng tôi sẽ khuyến khích các trình thu thập thông tin hỗn hợp tách biệt việc sử dụng tìm kiếm khỏi việc sử dụng tác nhân và huấn luyện.” > > — Matthew Prince, đồng sáng lập và CEO Cloudflare

---

Kiếm Tiền & Hiệu Quả Tài Nguyên

Để giúp nhà xuất bản kiếm tiền từ nội dung của họ trong kỷ nguyên AI, Cloudflare đang phát triển thị trường "Pay Per Crawl" thành một mô hình mới gọi là "Pay Per Use" (Trả Tiền Theo Lượt Sử Dụng).

* Pay Per Use: Mô hình này cho phép nhà xuất bản tính phí các công ty AI khi nội dung của họ thực sự tạo ra giá trị, thay vì chỉ khi nó được lấy về. * Đối tác ban đầu: Cloudflare đang triển khai sáng kiến này với hai đối tác ban đầu: * Ceramic.ai: Nhà xuất bản được trả tiền khi nội dung của họ xuất hiện trong kết quả tìm kiếm AI của Ceramic. * You.com: Nhà xuất bản được trả tiền khi You.com truy cập nội dung cao cấp của họ. * Tiết kiệm tài nguyên: Dữ liệu của Cloudflare tiết lộ rằng hơn 50% lưu lượng truy cập của trình thu thập thông tin AI bị lãng phí khi thu thập lại các trang không thay đổi. Việc chặn hoặc điều chỉnh các trình thu thập thông tin này sẽ giúp bảo tồn đáng kể băng thông và tài nguyên tính toán của nhà xuất bản.