Vào chiều thứ Sáu ngày 12/6 (giờ Mỹ), chính phủ Mỹ đã bất ngờ ra lệnh cho Anthropic lập tức tắt quyền truy cập vào hai mô hình AI mạnh nhất của họ là Claude Fable 5 và Claude Mythos 5 trên phạm vi toàn cầu, viện dẫn các mối lo ngại khẩn cấp về an ninh quốc gia. Anthropic đã xác nhận tuân thủ chỉ thị này nhưng đồng thời bày tỏ sự phản đối kịch liệt trước quyết định của giới chức Mỹ.
Tại sao vụ việc này lại gây chấn động?
Claude Mythos là mô hình AI có năng lực vượt trội nhất của Anthropic, được hé lộ lần đầu tiên vào đầu tháng 4 và liên tục được kiểm soát cực kỳ nghiêm ngặt qua chương trình thử nghiệm giới hạn mang tên Project Glasswing (chỉ chia sẻ với khoảng 50 tổ chức được chọn lọc kỹ lưỡng như Amazon, Apple, Google, Microsoft và CrowdStrike). Lý do là bởi Mythos sở hữu khả năng phân tích và tìm kiếm các lỗ hổng bảo mật cực kỳ nguy hiểm trong mã nguồn phần mềm của mọi hệ điều hành và trình duyệt lớn.
Để đáp lại áp lực thương mại, chỉ ba ngày trước, Anthropic đã chính thức ra mắt Claude Fable 5 – một phiên bản thương mại của Mythos được tích hợp các hệ thống phân loại độc lập nhằm chặn đứng các phản hồi nguy hiểm liên quan đến an ninh mạng và sinh học. Ngay lập tức, Fable 5 đã vươn lên vị trí mô hình AI mạnh mẽ nhất thế giới dành cho công chúng theo đánh giá từ Vals AI.
Lý do của chính phủ Mỹ: "Gậy ông đập lưng ông"?
Chỉ thị từ chính phủ Mỹ được ban hành dưới dạng biện pháp kiểm soát xuất khẩu nhằm hạn chế quyền truy cập của các thực thể nước ngoài. Tuy nhiên, trong một bài đăng chi tiết trên blog chính thức, Anthropic tiết lộ rằng mối quan ngại cốt lõi của chính phủ thực chất bắt nguồn từ một cáo buộc về lỗ hổng "bẻ khóa" (jailbreak) trên Fable 5.
Theo chính phủ Mỹ, lỗ hổng bẻ khóa hẹp này có thể cho phép người dùng lách qua các bộ lọc an toàn để ép mô hình đọc cơ sở mã nguồn và xác định các lỗi bảo mật. Anthropic lập tức phản pháo: 1. Giới chức Mỹ chỉ đưa ra bằng chứng bằng lời nói về một lỗi bẻ khóa hẹp và không mang tính phổ quát. 2. Mức độ năng lực này vốn đã xuất hiện rộng rãi trên các mô hình công khai khác như OpenAI GPT-5.5 và là công cụ tiêu chuẩn được các chuyên gia an ninh mạng sử dụng hàng ngày để phòng ngự. 3. Các biện pháp bảo vệ của Anthropic hoạt động dựa trên các bộ phân loại độc lập nằm ngoài mô hình chính, và dữ liệu sử dụng thực tế chưa ghi nhận bất kỳ trường hợp nào lách luật thành công để tạo ra mã độc hay gây hại thực tế.
> “Chúng tôi không đồng ý rằng việc phát hiện một lỗ bẻ khóa hẹp có khả năng xảy ra lại là lý do để thu hồi một mô hình thương mại đang phục vụ hàng trăm triệu người dùng,” Anthropic bức xúc tuyên bố. “Nếu tiêu chuẩn này được áp dụng cho toàn ngành, nó sẽ làm đóng băng toàn bộ các đợt ra mắt mô hình mới của mọi nhà phát triển hàng đầu.”
"Gậy ông đập lưng ông" và những lời chế giễu từ đối thủ
Sự việc lần này là một đòn giáng mạnh vào Anthropic khi công ty đang tích cực chuẩn bị cho đợt IPO lớn trong năm nay và luôn xây dựng hình ảnh thương hiệu là "gã khổng lồ AI an toàn nhất". Sự trớ trêu nằm ở chỗ, chính việc Anthropic cường điệu hóa sự nguy hiểm của Claude Mythos để thu hút sự chú ý đã vô tình khiến giới quản lý Mỹ "để mắt" và dẫn đến quyết định đóng cửa đột ngột này.
Sam Altman, CEO của OpenAI, chắc hẳn đang vô cùng đắc ý. Vào tháng 4 vừa qua, Altman từng công khai chế giễu chiến lược tiếp thị của Anthropic đối với mô hình bảo mật Mythos là “tiếp thị dựa trên nỗi sợ hãi” (fear-based marketing): > “Đó rõ ràng là một chiêu trò marketing không tưởng khi tuyên bố: 'Chúng tôi đã chế tạo ra một quả bom. Chúng tôi chuẩn bị thả nó xuống đầu bạn đây. Nhưng chúng tôi sẽ bán cho bạn một căn hầm trú ẩn trị giá 100 triệu USD.'”
Dù Altman không dự đoán trước một kịch bản đóng cửa hoàn toàn từ chính phủ, nhưng nhận định của ông đã hoàn toàn chính xác: Khi bạn dành nhiều tháng trời để thuyết phục thế giới rằng mô hình AI của bạn nguy hiểm ở mức độ độc nhất, chính phủ Mỹ sẽ lắng nghe – và hành động theo cách nghiêm ngặt nhất.
Vụ việc hiện đang dấy lên làn sóng tranh cãi dữ dội trong cộng đồng phát triển và nghiên cứu AI về ranh giới kiểm duyệt và sự can thiệp của chính phủ vào thị trường công nghệ frontier.