AI tools-ai 23 thg 6, 2026 6 phút đọc

OpenAI tung GPT-5.5-Cyber: Thách thức Claude Mythos của Anthropic trong cuộc chiến an ninh mạng! 🛡️💥

OpenAI vừa ra mắt GPT-5.5-Cyber chuyên sâu về an ninh mạng với chiến lược tiếp cận đa cấp, tạo ra cuộc đối đầu trực tiếp với Claude Mythos của Anthropic, dù các đánh giá độc lập cho thấy ưu thế khác nhau tùy vào bài kiểm tra.

Tier 2 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc the-decoder.com

OpenAI vừa tuyên bố một bước mở rộng chiến lược quan trọng trong lĩnh vực an ninh mạng do AI điều khiển bằng việc giới thiệu GPT-5.5-Cyber 🛡️, một phiên bản chuyên biệt cao của mô hình GPT-5.5 hàng đầu. Phiên bản này được tùy chỉnh riêng cho nghiên cứu an ninh mạng, phân tích lỗ hổng và kiểm tra thâm nhập. Sự ra mắt này là một phần trong nỗ lực lớn hơn thuộc chương trình "Trusted Access for Cyber" của OpenAI, nhằm mục đích vượt ra ngoài việc phát hiện lỗ hổng đơn thuần, hướng tới tự động vá các lỗ hổng mã nguồn mở trên quy mô lớn.

Động thái này đánh dấu sự leo thang trực tiếp trong cuộc cạnh tranh của OpenAI với Anthropic, khi Claude Mythos Preview bị hạn chế của Anthropic (được phát triển dưới "Project Glasswing" bí mật) đã giữ vững danh tiếng mạnh mẽ trong giới nghiên cứu bảo mật.

Mô hình truy cập theo cấp độ 🔑

Trong khi Anthropic áp dụng mô hình triển khai rất hạn chế cho Claude Mythos—chỉ giới hạn sử dụng cho khoảng 40-50 tổ chức được kiểm duyệt kỹ lưỡng—OpenAI đang thực hiện chiến lược truy cập theo cấp độ cho GPT-5.5:

1. Cấp độ Công cộng Tiêu chuẩn (ChatGPT và Public API): Sử dụng mô hình công khai tiêu chuẩn với các bộ lọc an toàn nghiêm ngặt và rào cản hành vi ngăn chặn việc tạo mã độc hại hoặc các yêu cầu khai thác tiềm tàng. 🔒 2. Cấp độ Phòng thủ: Có các bộ lọc được nới lỏng hơn, được thiết kế để hỗ trợ các tổ chức đã được kiểm duyệt và những người bảo vệ cơ sở hạ tầng quan trọng trong việc tìm và vá lỗi trước khi các tác nhân độc hại có thể khai thác chúng. 3. GPT-5.5-Cyber (Cấp độ Tấn công và Kiểm tra Thâm nhập): Cấp độ ít bị hạn chế nhất, cho phép các nhà bảo vệ được ủy quyền và các nhà nghiên cứu bảo mật hàng đầu thực hiện mô phỏng tấn công, kiểm tra thâm nhập, phân tích phần mềm độc hại và kiểm toán mã nguồn mở chuyên sâu. 🔓

OpenAI đã hợp tác với hơn 25 công ty bảo mật hàng đầu (bao gồm Cisco và CrowdStrike) và một số cơ quan chính phủ quốc tế để triển khai GPT-5.5-Cyber vào quy trình làm việc bảo mật thực tế.

So sánh GPT-5.5 và Claude Mythos trên chuẩn an ninh mạng 📊

Các đánh giá độc lập gần đây từ các cơ quan chính phủ và tổ chức học thuật đã làm nổi bật sự cạnh tranh gay gắt giữa hai mô hình tiên tiến này.

1. Đánh giá của Viện An toàn AI Vương quốc Anh (AISI) 🇬🇧

Viện An toàn AI của Vương quốc Anh đã kiểm tra cả hai mô hình trong một mô phỏng tấn công mạng đa giai đoạn toàn diện trên mạng lưới doanh nghiệp gồm 32 bước riêng biệt: - Nhiệm vụ cấp độ chuyên gia: GPT-5.5 đạt tỷ lệ thành công trung bình hơi cao hơn là 71.4% (±8.0%), vượt trội hơn Claude Mythos Preview với 68.6% (±8.7%). ✨ - Mô phỏng chuỗi tấn công đầy đủ (TLO): Claude Mythos Preview đã giải quyết hoàn chỉnh cuộc tấn công mạng đa giai đoạn trong 3/10 lần thử. GPT-5.5 thành công phá vỡ mạng lưới từ đầu đến cuối trong 2/10 lần thử. 📉 Cả hai mô hình đều thể hiện khả năng vượt trội, nhưng thường gặp khó khăn với các bước IT thượng nguồn hơn là chính các hệ thống điều khiển công nghiệp.

2. ExploitBench của Đại học Carnegie Mellon (CMU) 🇺🇸

Trong một bài kiểm tra riêng biệt được phát triển bởi các nhà nghiên cứu tại Đại học Carnegie Mellon (CMU) đo lường khả năng phát triển khai thác tự động cho công cụ JavaScript V8 của Google: - Claude Mythos Preview đã chứng minh một lợi thế đáng kể. Trong chế độ có sự hỗ trợ của con người ("nudges"), Mythos đạt 9.90 trên 16 điểm và thực hiện thành công mã đầy đủ trên 21 trong số 41 lỗ hổng. 🚀 - GPT-5.5 tụt hậu khá xa với 5.51 điểm, chỉ đạt được thực thi mã đầy đủ trên hai lỗ hổng. - Ở chế độ hoàn toàn tự động, Mythos giữ vững vị trí với 9.55 điểm, trong khi GPT-5.5 (thông qua Codex) giảm xuống 4.30 điểm.

Chi phí vận hành: "Cái giá" của trí tuệ 💰

Đối với các tổ chức đang lên kế hoạch chạy các quy trình quét lỗ hổng liên tục, yếu tố kinh tế của các mô hình này là một cân nhắc quan trọng. - Giá API của GPT-5.5: Có giá 5.00 USD/triệu token đầu vào và 30.00 USD/triệu token đầu ra. - Giá của Claude Mythos: Thậm chí còn đắt hơn, khiến các quy trình làm việc bảo mật dựa trên tác nhân kéo dài trở nên cực kỳ tốn kém. Các đội ngũ an ninh đang ngày càng áp dụng kiến trúc định tuyến đa mô hình (như MindStudio) để tối ưu hóa chi phí bằng cách gửi các tác vụ thông thường đến các mô hình nhỏ hơn và dành các mô hình tiên tiến hàng đầu cho các thách thức có độ phức tạp cao.

Định hướng chiến lược 🚀✨

Sự ra mắt của GPT-5.5-Cyber đại diện cho một bước ngoặt chiến lược quan trọng. Trong khi dòng Claude Mythos của Anthropic (bao gồm cả Claude Fable 5 có sẵn công khai nhưng bị lọc nghiêm ngặt) vẫn là một công cụ ưu việt cho việc tổng hợp khai thác sâu, thì chương trình truy cập theo cấp độ rộng rãi hơn của OpenAI và quan hệ đối tác với các nhà bảo vệ lớn như Cisco và CrowdStrike đang định vị GPT-5.5-Cyber trở thành tiêu chuẩn công nghiệp thực tế cho các quy trình làm việc bảo mật sản xuất trong tương lai gần.