Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 17 phút đọc

Claude Fable 5 Tạm Ngưng: Bài Học Đắt Giá Về Sự Phụ Thuộc AI Và "Khoảng Cách Kiểm Soát" Của Doanh Nghiệp! 🚨

Sự cố Claude Fable 5 bị tạm ngừng đột ngột đã làm nổi bật rủi ro phụ thuộc vào nhà cung cấp và sự thiếu hụt quản trị AI, thúc đẩy hai phần ba doanh nghiệp xây dựng chiến lược đa dạng hóa mô hình của họ.

Tier 2 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc venturebeat.com

Claude Fable 5 Tạm Ngưng: Bài Học Đắt Giá Về Sự Phụ Thuộc AI Và "Khoảng Cách Kiểm Soát" Của Doanh Nghiệp! 🚨

Trong vài tuần qua, sự cố xung quanh mô hình Claude Fable 5 của Anthropic đã trở thành một lời nhắc nhở rõ ràng về tầm quan trọng của việc đa dạng hóa chiến lược AI. Nghiên cứu mới từ VentureBeat Pulse cho thấy hai phần ba doanh nghiệp đã xây dựng "hàng rào phòng hộ" của riêng mình trước khi sự cố xảy ra.

Claude Fable 5: Một Cú Sốc Bất Ngờ cho Doanh Nghiệp 📉

Vào ngày 12 tháng 6, một lệnh kiểm soát xuất khẩu của Hoa Kỳ đã buộc Anthropic phải "rút" Claude Fable 5 – một trong những mô hình mạnh nhất thị trường – khỏi mọi khách hàng mà không hề có cảnh báo hay lộ trình cụ thể. Mô hình này chỉ quay trở lại gần đây với các biện pháp bảo vệ chặt chẽ hơn, sau khi Z.ai của Trung Quốc kịp thời ra mắt mô hình mã nguồn mở GLM-5.2 để lấp đầy khoảng trống.

Khảo sát của VentureBeat Pulse Research với 145 doanh nghiệp cho thấy hai phần ba trong số họ đã có chiến lược đa dạng hóa mô hình trước khi lệnh này được ban hành: 51% kết hợp các mô hình tiên tiến độc quyền (closed frontier models) với các mô hình mã nguồn mở (open-weight models) được triển khai trên hạ tầng của riêng họ, và 16% khác đang chuyển hoàn toàn các quy trình làm việc cốt lõi khỏi các API đóng. Phần ba còn lại, tiếc thay, đã hoàn toàn phụ thuộc vào các hệ sinh thái đóng khi sự cố xảy ra.

Khoảng Cách Kiểm Soát: Vấn Đề Lớn Hơn Sự Phụ Thuộc ⚠️

Sự cố mất điện của Claude Fable 5 đã làm nổi bật rõ rệt vấn đề phụ thuộc vào nhà cung cấp. Tuy nhiên, đây chỉ là phần nổi của một vấn đề sâu xa hơn: Hầu hết các doanh nghiệp thiếu khả năng giám sát để biết khi nào một hệ thống AI mà họ đưa vào sản xuất ngừng hoạt động chính xác.

* Chỉ 1 trong 10 doanh nghiệp có hệ thống giám sát tự động để phát hiện mô hình AI bị lệch lạc, hoạt động sai hoặc thất bại trong sản xuất. * Khoảng một phần tư sẽ chỉ biết về một sự cố sản xuất khi người dùng cuối (nội bộ hoặc bên ngoài) báo cáo, hoặc thậm chí không có khả năng hiển thị để phát hiện chúng. * Đáng báo động hơn, 79% các tổ chức doanh nghiệp đã chịu thiệt hại tài chính hoặc vận hành thực sự từ các tác nhân tự động – thường là do "AI bóng tối" (shadow AI), tức các tác vụ tự động không được phép do chính nhân viên của doanh nghiệp chạy bằng thẻ tín dụng công ty, nằm ngoài sự giám sát.

Chúng tôi gọi đây là "Khoảng cách Kiểm soát" (Control Gap) – khoảng cách giữa mức độ doanh nghiệp triển khai AI một cách tích cực và mức độ họ có thể nhìn thấy, sở hữu hoặc quản trị nó. Sự cố tháng 6 vừa qua đã biến khoảng cách này thành một bài kiểm tra căng thẳng thực tế.

Chi Phí Đắt Đỏ Của Sự Phụ Thuộc AI 💸

Claude Fable 5 ra mắt vào ngày 9 tháng 6 với sự hoan nghênh ngay lập tức – và cũng gây sốc với mức giá 10 USD cho mỗi triệu token đầu vào và 50 USD cho mỗi triệu token đầu ra. Chỉ ba ngày sau, lệnh kiểm soát xuất khẩu khẩn cấp của chính phủ Hoa Kỳ đã cấm công dân nước ngoài truy cập. Anthropic, không có cách nào để xác minh quốc tịch theo thời gian thực, đã tạm ngừng mô hình cho tất cả mọi người.

Trước đó, các doanh nghiệp cũng đã nếm trải bài học về chi phí phụ thuộc AI. Uber đã "đốt" sạch ngân sách mã hóa AI năm 2026 chỉ trong bốn tháng sau khi Claude Code được 84% trong số khoảng 5.000 kỹ sư của họ áp dụng, theo báo cáo của Forbes. Microsoft cũng đã hủy bỏ hầu hết giấy phép Claude Code nội bộ trong bộ phận Windows và Microsoft 365, chuyển hướng kỹ sư sang các công cụ của riêng mình, theo The Verge.

Tháng 6 đã bổ sung thêm một bài học khó hơn: Mô hình mà các quy trình làm việc của bạn phụ thuộc vào có thể biến mất chỉ sau một đêm, theo lệnh của chính phủ, không phải do quyết định của bạn hay nhà cung cấp. Trong khi đó, các công ty Trung Quốc như DeepSeek lại liên tục phát hành các mô hình mạnh mẽ, đột phá, giảm chi phí xuống chỉ còn một phần nhỏ so với các mô hình phương Tây.

Brian Craig, Giám đốc cấp cao về kiến trúc tại Liberty IT, cánh tay kỹ thuật của Liberty Mutual (một trong những công ty bảo hiểm lớn nhất thế giới), đã chứng kiến cả hai bài học này xảy ra trong thời gian thực. Craig là người Ireland, điều đó có nghĩa là lệnh kiểm soát xuất khẩu đã ảnh hưởng trực tiếp đến ông với tư cách là người dùng nước ngoài.

Craig chia sẻ tại sự kiện AI Impact của VentureBeat: "Fable xuất hiện, và ngay lập tức bạn thấy giá sử dụng nó, và bạn thốt lên, 'Ôi trời, nó phải thực sự tốt'. Nhưng may mắn thay, chúng tôi chưa kịp sử dụng đủ để yêu nó." Rồi nó biến mất.

Phòng Ngừa Rủi Ro: Chiến Lược Phổ Biến 🛡️

Công ty của Craig đã được xây dựng để tránh chính xác kiểu gián đoạn này. Liberty IT vận hành một "xương sống AI" (AI backbone) – khoảng 50 thành phần trải dài từ bảo mật, quản trị, khả năng quan sát (observability) và điều phối (orchestration), mỗi thành phần có thể thay thế độc lập.

"Bạn không thể khóa mình vào một nhà cung cấp và thậm chí là một framework duy nhất ngay bây giờ, bạn cần phải giữ sự linh hoạt với xương sống đó để có thể kết nối với các mô hình, nhà cung cấp khác nhau, tùy thuộc không quá nhiều vào ai đang 'hot' nhất, mà là vào những gì bạn có thể cảm thấy tự tin trong sáu tháng tới," Craig nói.

Cuộc khảo sát cho thấy Craig không đơn độc. 51% doanh nghiệp áp dụng chiến lược lai – mô hình tiên tiến độc quyền cho suy luận tổng quát, mô hình mã nguồn mở triển khai cục bộ cho các tác vụ chuyên biệt – và 16% đang thực hiện một sự chuyển đổi cứng rắn, chuyển các quy trình làm việc cốt lõi sang mô hình mã nguồn mở chạy trên đám mây lai hoặc đám mây riêng của họ. 32% còn lại duy trì cam kết với hệ sinh thái đóng vì chi phí vận hành tự lưu trữ vẫn lớn hơn lợi ích tiết kiệm chi phí đối với họ. Sau tháng 6, phép tính này đã có thêm một biến số mới.

Xu hướng "chuyển đổi nhà cung cấp" (defection) đang trở thành một chiến lược chủ động. Khi được hỏi nhà cung cấp AI chính nào họ có nhiều khả năng cắt giảm hoặc loại bỏ trong 12 tháng tới, 30% respondent đã nêu tên Microsoft đầu tiên – chủ yếu do cắt giảm Copilot và các framework Azure AI để ưu tiên truy cập mô hình trực tiếp – vượt qua 28% những người không có kế hoạch cắt giảm bất kỳ nhà cung cấp nào. OpenAI chiếm 21%, chủ yếu do biến động giá, với Anthropic ở mức 15% và Google ở mức 6%. Tuy không có nhà cung cấp nào phải đối mặt với một cuộc di cư lớn, nhưng lòng trung thành do quán tính đã chấm dứt: trong số các doanh nghiệp này, việc chủ động cắt giảm ít nhất một nhà cung cấp giờ đây phổ biến hơn việc mở rộng với tất cả các nhà cung cấp.

Chỉ 1 Trong 10 Doanh Nghiệp Phát Hiện Lỗi AI Tự Động 🤖

Làm thế nào một doanh nghiệp biết được nếu một trong những mô hình AI đang hoạt động của họ bị lệch lạc, hành xử không an toàn hoặc không hoàn thành nhiệm vụ? Chúng tôi đã hỏi trực tiếp. Bốn mươi phần trăm nói rằng họ rất tự tin sẽ phát hiện ra. Câu hỏi cũng hỏi sự tự tin đó dựa trên điều gì, và các respondent được chia thành hai nhóm: 30% dựa vào con người xem xét các đầu ra AI quan trọng, và chỉ 10% – 14 trong số 145 tổ chức – có hệ thống giám sát và cảnh báo tự động chạy đối với các hệ thống sản xuất. Các respondent còn lại giữ các vị trí yếu hơn: 32% mong đợi sẽ phát hiện hầu hết các vấn đề "cuối cùng," 19% nói rằng họ có khả năng sẽ nghe về một sự cố từ người dùng cuối trước tiên, và 8% báo cáo không có khả năng hiển thị hệ thống nào về hành vi AI trong sản xuất.

Sự khác biệt này rất quan trọng vì hai phương pháp này rất khác nhau. Đánh giá của con người có vẻ là tiêu chuẩn vàng, nhưng nó chỉ bao gồm các đầu ra được chỉ định là quan trọng để xem xét – và nó diễn ra với tốc độ mà con người có thể di chuyển, với sự không nhất quán mà bất kỳ quy trình thủ công nào cũng mang lại. Giám sát tự động xem xét mọi thứ mà hệ thống tạo ra, liên tục, và gắn cờ các bất thường khi chúng xảy ra – vì cùng lý do mà các doanh nghiệp đã ngừng phụ thuộc vào kiểm tra thủ công cho thời gian hoạt động và bảo mật một thập kỷ trước.

Khi khối lượng công việc của các tác nhân (agentic workloads) làm tăng lượng đầu ra vượt xa những gì bất kỳ nhóm đánh giá nào có thể đọc, phương pháp thủ công bắt đầu bị tụt lại phía sau. Các nhà lãnh đạo tại sự kiện của chúng tôi ở New York coi việc xem xét của con người là một kiểm soát được thiết kế với tự động hóa bên dưới nó. "Không có gì được triển khai vào sản xuất trừ khi có một người thực sự xem xét và ký duyệt, đó là lý do tại sao chúng tôi làm việc cho một công ty bảo hiểm," Craig nói về nhà máy phần mềm tác nhân của Liberty, nơi các tác nhân lập kế hoạch, mã hóa, kiểm tra, phê bình và thư viện vận chuyển các tính năng từ ý tưởng đến sản xuất. Todd Johnson, giám đốc điều hành của Morgan Stanley, cũng mô tả nguyên tắc tương tự từ tài chính: "Một trong những nguyên tắc mạnh mẽ của chúng tôi trong quản trị AI nói chung là luôn phải có trách nhiệm giải trình của con người, ngay cả khi có một mức độ tự động hóa nhất định."

Rào Cản Quản Trị Hàng Đầu: Vấn Đề Tổ Chức 🏢

Tại sao công cụ hiển thị AI không bao giờ được xây dựng? Câu trả lời của các respondent cho thấy đó là một thiếu sót về tổ chức. Rào cản được nhắc đến nhiều nhất để quản trị AI trên các nền tảng là sự thiếu vắng một chủ sở hữu hoặc đội ngũ chịu trách nhiệm duy nhất, ở mức 32%. Sự mờ mịt của nhà cung cấp theo sau ở mức 25%, thiếu công cụ ở mức 16% – và thiếu tài năng chỉ ở mức 5%.

Các kỹ năng tồn tại, nhưng nhiệm vụ của tổ chức thì không: Chỉ 38% nói rằng một đội ngũ trung tâm thực sự quản trị hành vi AI trên các nền tảng của họ hiện nay, 21% nói rằng quyền sở hữu không rõ ràng hoặc đang bị tranh chấp giữa các đội ngũ, và 17% nói rằng không có vai trò nào chịu trách nhiệm chính thức. 85% doanh nghiệp chạy hai hoặc nhiều nền tảng, mỗi nền tảng tự nhận là lớp AI "chính" – ERP, ITSM, bộ phần mềm năng suất, nền tảng dữ liệu, mỗi nền tảng có AI riêng, kiểm soát riêng và giả định riêng. 36% mô tả một cuộc cạnh tranh công khai giữa bốn hoặc nhiều hơn. Chỉ 8% đã hợp nhất thành một. Khi được hỏi trong một câu hỏi dạng tự do rằng họ sẽ khắc phục điều gì, các respondent đã đồng ý từ các hướng khác nhau về cùng một câu trả lời: một chủ sở hữu chịu trách nhiệm duy nhất và một mặt phẳng điều khiển (control plane) trừu tượng hóa chi phí, độ trôi và lựa chọn mô hình khỏi người dùng cuối.

79% Doanh Nghiệp Đã Trả Giá Cho Thất Bại Kiểm Soát AI 💰

Chi phí của khoảng trống này đang thể hiện rõ ràng trên thẻ tín dụng của công ty.

Khi được hỏi về thất bại kiểm soát tài chính hoặc vận hành nghiêm trọng nhất mà họ đã trải nghiệm từ các tác nhân tự động, 49% doanh nghiệp nêu ra "AI bóng tối" – các nhóm phòng ban chạy các đường ống tác nhân không được phép bằng thẻ tín dụng công ty, bỏ qua hoàn toàn sự giám sát tài chính trung tâm. 25% khác đã bị ảnh hưởng bởi hóa đơn "vòng lặp vô hạn" (infinite-loop bill), một quy trình làm việc đệ quy không được phát hiện đã tích lũy hàng nghìn USD chi phí token trong một sự cố duy nhất, và 6% bởi một tác nhân làm suy giảm cơ sở dữ liệu sản xuất với các truy vấn không được kiểm soát. Chỉ 21% báo cáo sự ổn định được bảo vệ, với việc giới hạn token cứng và giới hạn ngân sách ở lớp hạ tầng. Tổng cộng: 79% các doanh nghiệp này đã trả giá cho một thất bại kiểm soát tác nhân bằng tiền thật hoặc thời gian ngừng hoạt động thực sự.

Cuối cùng, kinh tế của token cho thấy áp lực sẽ tiếp tục tăng. Chi phí suy luận trên mỗi token đang giảm 70 đến 80% mỗi năm, và khối lượng công việc tác nhân tiêu thụ lượng token gấp 100 đến 500 lần so với các công cụ LLM mà chúng thay thế.

Brian Gracely, giám đốc cấp cao về chiến lược danh mục đầu tư tại Red Hat, nói với khán giả ở New York rằng câu trả lời bắt đầu bằng việc định cỡ phù hợp: "Nếu tôi chỉ đơn giản cố gắng giải quyết một yêu cầu bảo hiểm, tôi không cần biết về lịch sử văn minh phương Tây trong mô hình của mình. Tôi không cần biết điểm số bóng đá." Các doanh nghiệp đang kết hợp các mô hình nhỏ hơn, chuyên biệt với định tuyến ngữ nghĩa, ông nói, để nền tảng quyết định yêu cầu nào thực sự cần suy luận quy mô tiên tiến – và yêu cầu nào đang đốt token cao cấp cho công việc thông thường. (Một dữ liệu liên quan khác từ khảo sát nhấn mạnh sự thèm muốn thực dụng: 73% doanh nghiệp báo cáo rất ít hoặc không có gì đáng kể từ các khoản đầu tư tinh chỉnh tùy chỉnh của họ trong 18 tháng qua).

Điểm Mấu Chốt: Khả Năng Thay Thế Nhanh Hơn Quyền Sở Hữu 🚀

Cuộc khảo sát mô tả các doanh nghiệp đang tiến nhanh về AI với các kiểm soát yếu kém bên dưới. 58% đang thêm nhiều sáng kiến AI hơn là ngừng chúng. 85% chạy nhiều nền tảng, mỗi nền tảng tự nhận là lớp AI chính. Số lượng doanh nghiệp dựa vào đánh giá của con người để phát hiện một mô hình sản xuất bị lỗi gấp ba lần số doanh nghiệp có hệ thống giám sát tự động. Và 79% đã phải trả giá cho một thất bại kiểm soát tác nhân – thường là chi tiêu tác nhân trái phép bằng thẻ tín dụng công ty, ngoài sự giám sát của IT.

Tuy nhiên, có một vấn đề mà các doanh nghiệp rõ ràng đã thích nghi: sự phụ thuộc mô hình. Hai phần ba đã phòng ngừa chiến lược mô hình của họ, hoặc chạy các mô hình mã nguồn mở song song với các mô hình đóng (51%) hoặc chuyển hoàn toàn các quy trình làm việc cốt lõi khỏi các API đóng (16%). Sự cố Fable 5 đã cho thấy giá trị của vị thế đó – các công ty đã phòng ngừa có thể "đi vòng" qua một mô hình mà lệnh của chính phủ đã khiến không khả dụng chỉ sau một đêm.

Các vấn đề còn lại là nội bộ và không có khoản mua sắm nào có thể khắc phục chúng: 32% nêu ra việc thiếu một chủ sở hữu chịu trách nhiệm duy nhất là rào cản quản trị hàng đầu của họ, và 17% nói rằng không có vai trò nào chịu trách nhiệm chính thức về AI cả. Việc chỉ định một chủ sở hữu không tốn kém và không yêu cầu nhà cung cấp nào. Nhưng nó vẫn chưa xảy ra ở hầu hết các công ty này.

Làn sóng nghiên cứu Quý 3 sắp tới của chúng tôi sẽ đo lường xem liệu tháng 6 đã thay đổi điều này hay không – liệu các doanh nghiệp có chỉ định chủ sở hữu và cài đặt giám sát tự động, hay chỉ đơn giản là thêm một mô hình thứ hai và tiếp tục.