Anthropic, đối thủ lớn của OpenAI, hôm nay đã chính thức ra mắt hai mô hình AI mới: Claude Fable 5 và Claude Mythos 5. Đây là lần đầu tiên công ty này phổ biến rộng rãi khả năng AI cấp độ “Mythos” cực kỳ mạnh mẽ, vốn trước đây chỉ dành cho các tổ chức tham gia chương trình an ninh mạng giới hạn mang tên Project Glasswing – một dự án từng gây lo ngại về tiềm năng bị lạm dụng. 🌐
Fable 5: Sức Mạnh "Thần Thoại" Cho Mọi Người, Kèm Rào Cản An Toàn 🛡️
Claude Fable 5 là phiên bản mà hầu hết người dùng và nhà phát triển sẽ được tiếp cận từ hôm nay. Anthropic khẳng định Fable 5 vượt trội hơn mọi mô hình Claude đã ra mắt trước đó, với hiệu suất mạnh mẽ hơn đáng kể trong các lĩnh vực như kỹ thuật phần mềm, công việc tri thức, thị giác máy tính, nghiên cứu khoa học và các tác vụ dài hạn. Fable 5 đạt điểm cao trên gần như tất cả các tiêu chuẩn hiện có, dù phiên bản Claude Mythos Preview trước đó vẫn giữ vị trí dẫn đầu ở các tác vụ sử dụng máy tính và lý luận đa ngành.
Điểm đặc biệt của Fable 5 là nó gói gọn khả năng cấp độ Mythos với các lớp bảo vệ mới. Anthropic cho biết, các yêu cầu liên quan đến những lĩnh vực rủi ro cao – bao gồm an ninh mạng, sinh học và hóa học, hoặc cố gắng chắt lọc (distill) khả năng của mô hình – sẽ tự động được chuyển hướng sang Claude Opus 4.8. Người dùng sẽ nhận được thông báo khi điều này xảy ra. Công ty tuyên bố hơn 95% phiên làm việc với Fable được thực hiện hoàn toàn bởi Fable mà không cần chuyển đổi, và qua hơn 1.000 giờ thử nghiệm nội bộ và bên ngoài, không tìm thấy bất kỳ "jailbreak" (phương pháp phá vỡ hạn chế) phổ quát nào. 🕵️♀️
Claude Mythos 5: Sức Mạnh Vượt Ngưỡng Cho Người Dùng Đặc Biệt 🚀
Ngược lại, Claude Mythos 5 là một phiên bản nâng cấp, hạn chế hơn của mô hình Mythos Preview. Phiên bản này được gỡ bỏ một số rào cản bảo vệ cho các đối tượng được phê duyệt, bao gồm các đối tác an ninh mạng của Anthropic trong Project Glasswing và một số nhà nghiên cứu sinh học chọn lọc. Điều này có nghĩa là Mythos 5 mạnh mẽ hơn Fable 5 đối với các công việc nhạy cảm về an ninh mạng và sinh học, vì nó có thể xử lý các câu hỏi mà Fable 5 sẽ phải chuyển hướng. Đối với hầu hết các tác vụ doanh nghiệp và phát triển thông thường, Anthropic cho biết Fable 5 hoạt động hiệu quả tương tự Mythos 5.
Giá Cả "Khó Nhằn" và Lộ Trình Phát Hành Phức Tạp 💰
Anthropic định giá cả Fable 5 và Mythos 5 ở mức 10 USD/triệu token đầu vào và 50 USD/triệu token đầu ra. Mức giá này được cho là chưa bằng một nửa so với Claude Mythos Preview, nhưng vẫn đứng đầu bảng về độ đắt đỏ so với các mô hình AI lớn khác trên toàn cầu, theo thống kê của VentureBeat. 💸
Bảng So Sánh Giá API Các Mô Hình AI Tiên Tiến (Đơn vị: USD/triệu token)
| Mô hình | Đầu vào | Đầu ra | Tổng chi phí | Nguồn | | :-------------------- | :------ | :----- | :----------- | :--------------------- | | MiMo-V2.5 Flash | $0.10 | $0.30 | $0.40 | Xiaomi MiMo | | deepseek-v4-flash | $0.14 | $0.28 | $0.42 | DeepSeek | | ... | ... | ... | ... | ... | | Claude Opus 4.8 | $5.00 | $25.00 | $30.00 | Anthropic | | GPT-5.5 | $5.00 | $30.00 | $35.00 | OpenAI | | Claude Fable 5 / Claude Mythos 5 | $10.00 | $50.00 | $60.00 | Anthropic |
(Nguồn: VentureBeat Frontier AI Model API Pricing Snapshot)
Đối với người dùng đăng ký, lộ trình triển khai Fable 5 khá phức tạp. Mô hình này sẽ được tích hợp vào các gói Pro, Max, Team và Enterprise (có tính phí theo chỗ ngồi) miễn phí từ nay đến ngày 22 tháng 6. Tuy nhiên, từ ngày 23 tháng 6, Fable 5 sẽ bị gỡ bỏ khỏi các gói này và yêu cầu tín dụng sử dụng riêng. Anthropic cho biết họ đặt mục tiêu khôi phục Fable 5 trở lại như một phần tiêu chuẩn của các gói đăng ký sớm nhất có thể. Điều này có thể gây khó chịu cho người dùng đã quen với Fable 5 trong giai đoạn đầu. 🗓️
Bước Tiến Vượt Bậc Trong Lập Trình Tự Động 🧑💻
Đối với các doanh nghiệp, trường hợp sử dụng nổi bật nhất của Fable 5 có lẽ là kỹ thuật phần mềm. Anthropic khẳng định Fable 5 có thể làm việc tự động trong thời gian dài hơn và độc lập hơn so với các mô hình Claude trước đây. Đây chính xác là khả năng mà các doanh nghiệp cần nếu muốn các tác nhân AI thực hiện nhiều hơn là chỉ tự động hoàn thành mã hoặc trả lời câu hỏi của nhà phát triển. 💡
Trên SWE-bench Pro, một tiêu chuẩn đo lường khả năng hoàn thành các tác vụ kỹ thuật phần mềm khó khăn, Fable 5 và Mythos 5 đạt 80.3%, vượt xa GPT-5.5 của OpenAI (58.6%). Khách hàng như Stripe đã thử nghiệm Fable 5 trong một cơ sở mã Ruby 50 triệu dòng và nhận thấy mô hình này đã hoàn thành một dự án di chuyển toàn bộ cơ sở mã chỉ trong một ngày, công việc mà nếu làm thủ công sẽ mất hơn hai tháng cho một nhóm kỹ sư. Điều này cho thấy tiềm năng to lớn của Fable 5 trong các tác vụ phát triển dài hơi như di chuyển cơ sở mã, tạo mẫu ứng dụng, xem xét pull request và gỡ lỗi.
Nâng Tầm Công Việc Tri Thức, Tài Chính và Pháp Lý 📊⚖️
Anthropic cũng định vị Fable 5 là một mô hình mạnh mẽ hơn cho các công việc tri thức trong doanh nghiệp. Trên tiêu chuẩn GDPval-AA, Fable 5 và Mythos 5 đạt 1932 điểm, cao hơn Claude Opus 4.8 (1890) và GPT-5.5 (1769). Đặc biệt, trên GDPpdf – một tiêu chuẩn tập trung vào lý luận tài liệu trực quan – Fable 5 và Mythos 5 đạt 29.8% mà không cần công cụ, vượt trội so với Opus 4.8 (22.5%) và GPT-5.5 (24.9%).
Điều này rất quan trọng vì phần lớn công việc của doanh nghiệp vẫn nằm trong các tài liệu phức tạp: PDF, bảng tính, biểu đồ, báo cáo, hợp đồng. Fable 5 cho thấy sự cải thiện đáng kể trong lý luận dựa trên tài liệu, diễn giải biểu đồ và bảng, cùng khả năng giải quyết vấn đề phức tạp. Các công ty tài chính như IMC, Optiver và Balyasny Asset Management đã ca ngợi khả năng phân tích giao dịch, lý luận khái niệm và phân tích giá trị kỳ vọng của Fable 5. Các nhóm pháp lý và vận hành cũng có thể hưởng lợi ngay lập tức; Crosby Legal nhận thấy các đề xuất chỉnh sửa hợp đồng của Fable 5 thường ngang bằng hoặc tốt hơn mô hình hiện tại, trong khi Notion và Zapier mô tả mô hình này giúp chuyển đổi ghi chú lộn xộn thành kế hoạch dự án chức năng và tự động hóa tác vụ tốt hơn.
Đột Phá Trong Hiểu Biết Thị Giác và Giao Diện 👁️🗨️
Fable 5 cũng là mô hình thị giác mạnh mẽ nhất của Anthropic. Công ty cho biết mô hình này có thể trích xuất số liệu chính xác từ các hình ảnh khoa học chi tiết và hoàn thành các tác vụ dựa trên thị giác như tái tạo mã nguồn của một ứng dụng web chỉ từ ảnh chụp màn hình. Điều này có ý nghĩa lớn đối với tự động hóa doanh nghiệp, đặc biệt khi nhiều quy trình nghiệp vụ vẫn phụ thuộc vào giao diện trực quan như bảng điều khiển, PDF cũ, biểu mẫu và báo cáo hình ảnh nặng.
Fable 5 cũng cần ít “giàn giáo” (scaffolding) hơn các mô hình Claude trước đó. Anthropic đã trình diễn khả năng của Fable 5 khi mô hình này thậm chí còn vượt qua trò chơi Pokémon FireRed chỉ với một hệ thống thị giác tối thiểu, trong khi các mô hình Claude cũ hơn gặp khó khăn ngay cả khi có thêm công cụ. Điều này không chỉ là về khả năng chơi game, mà là kỹ năng tác nhân rộng hơn: đọc môi trường trực quan, ghi nhớ tiến trình, quyết định hành động tiếp theo và thực hiện trong một khoảng thời gian dài. 🎮
Thách Thức Từ Mô Hình "Nguy Hiểm Tiềm Tàng" Đến AI Doanh Nghiệp Toàn Diện ⚖️
Việc ra mắt Fable 5 diễn ra sau khi Anthropic triển khai Claude Mythos Preview thông qua Project Glasswing vào tháng 4 năm 2025 – một chương trình hạn chế dành cho các chuyên gia phòng thủ mạng, nhà cung cấp hạ tầng quan trọng. Anthropic đã tạo ra Glasswing sau khi đánh giá nội bộ cho thấy các mô hình cấp độ Mythos có thể tìm và khai thác lỗ hổng phần mềm ở mức độ đáng lo ngại về nguy cơ lạm dụng. ⚠️
Các quan chức và cơ quan tình báo Mỹ đã cân nhắc về cách các mô hình như vậy có thể định hình lại cả phòng thủ và tấn công mạng. Thượng nghị sĩ Mark Warner cảnh báo rằng việc phát hiện lỗ hổng được hỗ trợ bởi AI sẽ buộc ngành công nghiệp phải “đẩy nhanh và ưu tiên vá lỗi”. Ngay cả các cơ quan quản lý tài chính cũng đã để ý, với The Guardian đưa tin rằng Mythos đã được thảo luận giữa các quan chức ngân hàng cấp cao ở Mỹ và Anh do lo ngại các cuộc tấn công mạng được tăng tốc bởi AI có thể đe dọa hệ thống thanh toán và ổn định tài chính. Tuy nhiên, Anthropic cũng phải đối mặt với sự giám sát về khả năng kiểm soát an toàn những khả năng mà họ cho là quá rủi ro để phát hành rộng rãi, điển hình là việc The Verge đưa tin về việc người dùng trái phép đã truy cập Mythos sau khi nó được triển khai giới hạn.
Với Fable 5, Anthropic đang thể hiện vai trò “người gác cổng” của mình, nỗ lực tách biệt giá trị doanh nghiệp tổng thể của một mô hình cấp độ Mythos khỏi những phần năng lực rủi ro nhất. Các bộ phân loại của Fable 5 bao gồm ba lĩnh vực chính:
1. An ninh mạng: Mô hình Mythos-class có thể phát hiện và khai thác lỗ hổng, thực hiện các tác vụ “hacking tác nhân” rộng hơn. 💻 2. Sinh học và hóa học: Khả năng lý luận giúp các nhà nghiên cứu thiết kế liệu pháp cũng có thể bị những kẻ xấu có nguồn lực sử dụng cho công việc sinh học nguy hiểm. 🧪 3. Chắt lọc mô hình (Model distillation): Người dùng có thể cố gắng trích xuất khả năng của Claude để huấn luyện các mô hình cạnh tranh, bao gồm cả những mô hình có thể được phát hành mà không có biện pháp bảo vệ tương tự.
Khi các bộ phân loại của Fable 5 phát hiện một trong các danh mục này, phản hồi sẽ tự động được xử lý bởi Claude Opus 4.8. Anthropic tuyên bố đã thử nghiệm hệ thống phân loại mới này một cách nghiêm ngặt, với hơn 1.000 giờ thử nghiệm nội bộ và từ các tổ chức bên ngoài mà không tìm thấy "jailbreak" phổ quát.
Chính Sách Lưu Giữ Dữ Liệu Mới: Một Thách Thức Lớn Cho Doanh Nghiệp 🔒
Anthropic cũng đã giới thiệu một chính sách lưu giữ dữ liệu mới cho các mô hình cấp độ Mythos-class. Công ty sẽ yêu cầu lưu giữ 30 ngày đối với tất cả lưu lượng truy cập trên Fable 5, Mythos 5 và các mô hình tương lai có cấp độ khả năng tương tự hoặc cao hơn. Anthropic cam kết không sử dụng dữ liệu này để huấn luyện các mô hình Claude mới hoặc cho các mục đích không liên quan đến an toàn, và đã bổ sung các biện pháp bảo vệ quyền riêng tư. Tuy nhiên, chính sách này có thể trở thành một trong những câu hỏi mua hàng quan trọng nhất đối với các doanh nghiệp, đặc biệt là trong các ngành được quản lý chặt chẽ về dữ liệu. Anthropic lập luận rằng việc giám sát mạnh mẽ hơn là cần thiết cho các mô hình có cấp độ khả năng này. 💬
Kết Luận: Một Làn Gió Mới Cho AI Doanh Nghiệp, Nhưng Đâu Là Giới Hạn? 🚀
Ý nghĩa rộng lớn hơn của Fable 5 đối với doanh nghiệp là Anthropic đang cố gắng thương mại hóa một loại mô hình AI tự động hơn mà không phơi bày tất cả khả năng của nó cho mọi người dùng. Điều này có thể trở thành một khuôn mẫu cho cách các phòng thí nghiệm tiên tiến phát hành các hệ thống ngày càng mạnh mẽ: cùng một dòng mô hình, nhiều cấp độ truy cập và các hạn chế theo từng miền tùy thuộc vào độ tin cậy và rủi ro của người dùng.
Nếu Fable 5 hoạt động như Anthropic và các khách hàng sớm mô tả, các nhà phát triển có thể giao phó các tác vụ lớn hơn như di chuyển mã, tái cấu trúc, xây dựng giao diện người dùng, viết thử nghiệm, sửa lỗi, tạo tài liệu và tạo ứng dụng nhiều bước. Đối với các doanh nghiệp nặng về công việc tri thức, Fable 5 có thể làm cho AI hữu ích hơn trong các quy trình làm việc mà các mô hình trước đây quá yếu kém: nghiên cứu tài chính, phân tích bảng tính, chỉnh sửa hợp đồng pháp lý, xem xét mua sắm, tài liệu hội đồng quản trị, nghiên cứu thị trường, vận hành bán hàng và lập kế hoạch dự án. 📈
Đối với các nhóm bảo mật, việc ra mắt phức tạp hơn. Hầu hết các tổ chức sẽ nhận được Fable 5 chứ không phải Mythos 5 không hạn chế. Điều đó có nghĩa là họ có thể thấy khả năng mã hóa và phân tích tổng quát mạnh hơn, nhưng không có quyền truy cập đầy đủ vào các khả năng an ninh mạng mà Anthropic coi là rủi ro. Các nhà bảo vệ đáng tin cậy trong Project Glasswing sẽ có được Mythos 5, cho phép họ sử dụng mô hình trực tiếp hơn để phát hiện lỗ hổng và kiểm tra phòng thủ. Điều tương tự cũng xảy ra với các công ty khoa học đời sống.
Việc ra mắt cũng làm tăng áp lực cạnh tranh trên toàn ngành AI. Anthropic đang tuyên bố đạt được kết quả dẫn đầu về mã hóa tác nhân, công việc tri thức, thị giác, an ninh mạng, lý luận pháp lý, lý luận không gian và các tiêu chuẩn sức khỏe. Nhưng tuyên bố quan trọng hơn về mặt chiến lược có thể là việc họ đã tìm ra một cơ chế phát hành khả thi cho các mô hình cao hơn cấp độ Opus của mình. Nếu các biện pháp bảo vệ của Fable 5 được duy trì trong sử dụng thực tế, Anthropic sẽ lập luận rằng họ có thể đưa các mô hình mạnh mẽ hơn ra thị trường sớm hơn mà không cần mở hoàn toàn các khả năng rủi ro nhất. Một mô hình có thể hoàn thành nhiều công việc tự động hơn cũng có thể tiêu tốn nhiều token hơn, gây ra nhiều câu hỏi quản trị hơn và tạo ra gánh nặng đánh giá mới cho các nhóm phải xác minh kết quả của nó. Tuy nhiên, Fable 5 và Mythos 5 đã đánh dấu một sự thay đổi rõ ràng trong dòng sản phẩm Claude: Các mô hình cấp độ Mythos giờ đây đã đứng trên Opus. 🌟