Anthropic 'Tách Não Khỏi Tay' Tác Nhân AI Quản Lý: Đột Phá Về Hiệu Năng và Bảo Mật! 🧠🛡️
* Nguồn: Anthropic Engineering Blog * Ngày xuất bản: 08/04/2026 * Chủ đề cốt lõi: Ảo hóa các thành phần của tác nhân (phiên làm việc, công cụ điều phối, môi trường sandbox) để xây dựng một dịch vụ lưu trữ ổn định, có thể mở rộng và bảo mật cho các tác vụ tác nhân dài hạn.
---
Tóm Lược: Cách Anthropic Cách Mạng Hóa Tác Nhân AI Quản Lý
Khi các mô hình AI ngày càng thông minh hơn, những giả định được mã hóa trong các “công cụ điều phối” (harness – các vòng lặp quản lý cuộc gọi LLM và công cụ) nhanh chóng trở nên lỗi thời. Để giải quyết vấn đề này, Anthropic đã phát triển Tác Nhân AI Quản Lý (Managed Agents), một dịch vụ lưu trữ trên nền tảng Claude.
Bằng cách ảo hóa và tách rời các thành phần cốt lõi của tác nhân – phân chia “bộ não” (Claude và công cụ điều phối của nó) khỏi “đôi tay” (môi trường sandbox và các công cụ thực thi) và “phiên làm việc” (nhật ký sự kiện bền vững) – Anthropic đã giải quyết thành công các vấn đề quan trọng liên quan đến độ tin cậy của hạ tầng, bảo mật, kết nối mạng và độ trễ.
Vấn Đề Đau Đầu: Kiến Trúc “Vật Nuôi” (Gắn Kết Chặt Chẽ)
Ban đầu, Anthropic đặt tất cả các thành phần của tác nhân (phiên làm việc, công cụ điều phối và môi trường sandbox) vào một container duy nhất. Thiết kế “gắn kết” này đã tạo ra nhiều nút thắt kỹ thuật đáng kể:
* Vấn đề Hạ tầng “Vật nuôi” (Pet Infrastructure): Nếu một container bị lỗi hoặc không phản hồi, toàn bộ phiên làm việc sẽ bị mất. Các kỹ sư phải “chăm sóc” từng container để khôi phục hoạt động, một công việc tốn kém và không hiệu quả. * Điểm mù Gỡ lỗi: Cửa sổ duy nhất để theo dõi bên trong container là luồng sự kiện WebSocket. Nếu một phiên bị kẹt, các kỹ sư không thể dễ dàng xác định lỗi nằm ở công cụ điều phối, luồng sự kiện hay chính container. Việc mở shell bên trong container bị hạn chế do vấn đề bảo mật dữ liệu người dùng. * Hạn chế Mạng: Vì công cụ điều phối nằm bên trong container, nó giả định tất cả các tài nguyên đích đều là cục bộ. Việc kết nối Claude với Mạng riêng ảo (VPC) của khách hàng đòi hỏi ghép nối mạng phức tạp hoặc chạy công cụ điều phối trên hạ tầng của khách hàng. * Giả định lỗi thời (“Nỗi lo về ngữ cảnh”): Các công cụ điều phối thường mã hóa các giải pháp tạm thời cho hạn chế của mô hình. Ví dụ, Claude Sonnet 4.5 thường kết thúc các tác vụ sớm khi gần đến giới hạn ngữ cảnh của nó (“nỗi lo về ngữ cảnh”), yêu cầu thiết lập lại ngữ cảnh trong công cụ điều phối. Tuy nhiên, trong Claude Opus 4.5, hành vi này đã biến mất, khiến việc thiết lập lại trở thành “gánh nặng vô ích” và lỗi thời.
Giải Pháp Đột Phá: Kiến Trúc Tách Rời
Để vượt qua những thách thức trên, Anthropic đã ảo hóa tác nhân thành ba giao diện riêng biệt, có thể hoán đổi cho nhau, tạo nên một kiến trúc linh hoạt và mạnh mẽ:
[ Nhật ký Phiên làm việc ] <---> [ Bộ não (Công cụ điều phối + Claude) ] <---> [ Đôi tay (Sandbox / Công cụ) ]
1. Bộ Não (Công cụ Điều Phối) Rời Khỏi Container
Công cụ điều phối không còn nằm bên trong container thực thi. Nó coi container như một công cụ không trạng thái:
* Nếu một container chết, công cụ điều phối sẽ bắt lỗi đó như một lỗi gọi công cụ, chuyển cho Claude và cung cấp một container mới nếu Claude quyết định thử lại. * Bản thân công cụ điều phối là không trạng thái và có thể hoán đổi (“gia súc” chứ không phải “vật nuôi”). Nếu nó gặp sự cố, một cái mới sẽ khởi động lại, lấy nhật ký sự kiện và tiếp tục từ trạng thái đã lưu.
2. Đôi Tay (Sandboxes & Công Cụ)
Môi trường sandbox được coi là một môi trường thực thi tùy ý. Công cụ điều phối vẫn không phụ thuộc vào việc “bàn tay” là một container, một thiết bị vật lý như điện thoại hay một trình giả lập. Điều này mở ra khả năng tích hợp đa dạng và linh hoạt.
3. Phiên Làm Việc (Nhật Ký Sự Kiện Bền Vững)
Nhật ký phiên làm việc tồn tại hoàn toàn bên ngoài cửa sổ ngữ cảnh hoạt động của Claude, đóng vai trò là một lịch sử bền vững, có thể truy vấn được. Điều này đảm bảo tính toàn vẹn và khả năng phục hồi của các tác vụ dài hạn.
Các Giao Diện Chính & Mã Lập Trình
Kiến trúc tách rời dựa trên một bộ nhỏ các giao diện trừu tượng, ổn định để quản lý các thành phần:
Thực thi Container & Công cụ
* Thực thi hành động của công cụ/sandbox: execute(name, input) → string * Cung cấp tài nguyên sandbox: provision({resources})
Phục hồi Công cụ điều phối & Ghi nhật ký Phiên làm việc
* Khởi động lại công cụ điều phối bị lỗi: wake(sessionId) * Truy xuất nhật ký sự kiện: getSession(id) * Ghi vào nhật ký phiên làm việc: emitEvent(id, event) * Thẩm vấn ngữ cảnh (cắt lát vị trí của luồng sự kiện): getEvents()
Bảo Mật & Cô Lập Thông Tin Đăng Nhập
Trong các hệ thống gắn kết, mã không đáng tin cậy do Claude tạo ra chạy trong cùng môi trường với thông tin đăng nhập API, khiến tấn công injection trở nên cực kỳ nguy hiểm. Anthropic đã giải quyết vấn đề này bằng cách đảm bảo các token không bao giờ có thể tiếp cận được từ sandbox:
* Đối với Git: Hệ thống sử dụng token truy cập của kho lưu trữ để clone repo trong quá trình khởi tạo sandbox và kết nối nó vào remote git cục bộ. Các chức năng push và pull của Git hoạt động bên trong sandbox mà tác nhân không bao giờ phải xử lý token. * Đối với Công cụ Tùy chỉnh (MCP): Token OAuth được lưu trữ trong một kho bảo mật riêng biệt. Claude gọi các công cụ Giao thức Ngữ cảnh Mô hình (MCP) thông qua một proxy chuyên dụng. Proxy này lấy thông tin đăng nhập từ kho bằng cách sử dụng một token phiên làm việc, giữ cho công cụ điều phối và sandbox hoàn toàn “mù” với các thông tin nhạy cảm này.
Kỹ Thuật Ngữ Cảnh: Phiên Làm Việc so với Cửa Sổ Ngữ Cảnh
Các tác vụ dài hạn thường dễ dàng vượt quá cửa sổ ngữ cảnh của Claude. Mặc dù các kỹ thuật như nén (tóm tắt) và cắt bớt ngữ cảnh giúp ích, nhưng chúng thường đưa ra các quyết định không thể đảo ngược về những gì sẽ loại bỏ, dẫn đến mất thông tin quan trọng.
Với Managed Agents, Anthropic coi nhật ký phiên làm việc như một đối tượng ngữ cảnh bên ngoài:
* “Bộ não” sử dụng getEvents() để chọn lọc các sự kiện liên quan và xây dựng cửa sổ ngữ cảnh một cách linh hoạt. * Đầu ra công cụ cũ hơn có thể được nén hoặc xóa khi cần, trong khi các quyết định cấp cao và tóm tắt phiên làm việc được giữ lại vĩnh viễn, đảm bảo tính liên tục và khả năng học hỏi dài hạn của tác nhân.
---
Đây thực sự là một bước tiến đáng kể trong việc kiến tạo các hệ thống AI ổn định, an toàn và có khả năng mở rộng trong tương lai. Kalera News sẽ tiếp tục theo dõi sát sao những đổi mới thú vị này! 🚀