IBM Research Ra Mắt CUGA: Nền Tảng Agent Đa Năng Mã Nguồn Mở Hàng Đầu Cho Doanh Nghiệp!
CUGA (Configurable Generalist Agent - Tác nhân Đa năng có khả năng cấu hình) là một framework tác nhân đa năng, mã nguồn mở, tiên tiến (SOTA) được IBM Research phát triển, chú trọng đến độ tin cậy cấp doanh nghiệp và khả năng điều phối các tác vụ phức tạp. CUGA cho phép các nhà phát triển kết nối liền mạch các API và máy chủ Giao thức Ngữ cảnh Mô hình (MCP), điều chỉnh chế độ thực thi và quản lý hành vi của tác nhân bằng các chính sách mạnh mẽ mà không cần xây dựng logic điều phối từ đầu. 💡
CUGA được thiết kế để xử lý các quy trình làm việc tác nhân phức tạp, đa bước mà các hệ thống LLM truyền thống thường gặp khó khăn hoặc “ảo giác”. Nền tảng này hoàn toàn có thể ghép nối, mở rộng và sẵn sàng để triển khai trong môi trường thử nghiệm doanh nghiệp.
* Kho lưu trữ GitHub: cuga-project/cuga-agent * Tài liệu: docs.cuga.dev * Bản demo trực tiếp (Live Space): Hugging Face Spaces
---
Hiệu suất Chuẩn: Vững vàng Ngôi vị Số 1 🏆
CUGA đã chứng minh ưu thế về kỹ thuật của mình bằng cách đạt được kết quả tiên tiến hàng đầu trên các bảng xếp hạng tác nhân AI nổi bật: * Số 1 trên AppWorld: Vượt trội hơn tất cả các framework thương mại và mã nguồn mở cạnh tranh trên 750 tác vụ thực tế qua 457 API. * Hàng đầu trên WebArena: Hiệu suất cực cao cho các tác nhân web/trình duyệt tự động điều hướng các bộ ứng dụng phức tạp.
---
Kiến trúc Chuyên sâu & Các Tính năng Chính
Thay vì chỉ là một lớp vỏ bọc đơn giản quanh các mô hình ngôn ngữ lớn (LLM), CUGA được xây dựng như một middleware tác nhân hoàn chỉnh. Các khả năng kiến trúc chính bao gồm:
| Tính năng | Mô tả Kỹ thuật | Chi tiết Triển khai | | :--- | :--- | :--- | | Tích hợp Công cụ | Hỗ trợ gốc cho thông số kỹ thuật OpenAPI, máy chủ MCP và bộ công cụ LangChain. | Quản lý qua mcp_servers.yaml hoặc đăng ký theo chương trình. | | Lập kế hoạch có cấu trúc | Diễn giải ý định người dùng thành mục tiêu, được phân tách thành các tác vụ con được theo dõi qua sổ cái động. | Hỗ trợ lập kế hoạch lại tức thì và vòng lặp khôi phục lỗi. | | Suy luận Thích ứng | Chuyển đổi giữa các chế độ thực thi: fast (nhanh), balanced (cân bằng) (mặc định), accurate (chính xác), hoặc custom (tùy chỉnh). | Cấu hình qua [features] cuga_mode trong settings.toml. | | Chế độ Tác vụ Linh hoạt | Hoạt động qua ba chế độ tác vụ: api (gọi REST trực tiếp), web (do trình duyệt điều khiển), hoặc hybrid (lai). | Thiết lập qua [advanced_features] mode = 'hybrid' để kết hợp API và Web. | | Khả năng Ghép nối Đa tác nhân | Điều phối các quy trình phức tạp bằng cách sử dụng các giám sát viên. | Chạy giám sát viên bằng cuga start demo_supervisor. | | Chính sách Doanh nghiệp Tích hợp | Tách biệt quy tắc tuân thủ và kinh doanh khỏi nhắc lệnh LLM với 5 loại chính sách. | Intent Guards, Playbooks, Tool Approvals, Tool Guides, và Output Formatters. | | Kiến thức Chuyên sâu (RAG) | Tích hợp gốc với Docling để phân tích tài liệu PDF, Word, HTML và hình ảnh với độ chính xác cao. | Hỗ trợ phạm vi cấp tác nhân và cấp phiên. | | Kỹ năng của Tác nhân | Các gói hướng dẫn khai báo có thể tái sử dụng (SKILL.md với phần đầu YAML). | Được tải động trong thời gian chạy. |
---
Bắt đầu Nhanh: Chạy Bản Demo CRM ⚡
Điều kiện Tiên quyết
* Python 3.12+ * Trình quản lý gói uv (được khuyến nghị)
Thiết lập và Demo CLI
Chạy bản demo CRM cục bộ chỉ với vài lệnh:
```bash # 1. Sao chép kho lưu trữ git clone https://github.com/cuga-project/cuga-agent.git cd cuga-agent
2. Tạo và kích hoạt môi trường ảo Python
uv venv --python=3.12 && source .venv/bin/activate
3. Đồng bộ hóa các phụ thuộc
uv sync
4. Cấu hình biến môi trường
echo "OPENAI_API_KEY=your-api-key-here" > .env
5. Khởi động bản demo CRM cục bộ
cuga start demo_crm --read-only
6. Xem bảng điều khiển quỹ đạo tác nhân
cuga viz ```
Bản demo CRM trình diễn khả năng của CUGA trong một không gian làm việc giả lập an toàn với các API, cấu trúc cơ sở dữ liệu và chính sách thời gian chạy được cấu hình sẵn.
---
Tích hợp Lập trình (Python SDK) 💻
CUGA có thể được nhúng trực tiếp vào các ứng dụng tùy chỉnh. Dưới đây là một ví dụ về việc khởi tạo một Tác nhân CUGA, thêm các công cụ tùy chỉnh và áp dụng Chính sách Intent Guard theo chương trình:
```python import asyncio from cuga import CugaAgent from langchain_core.tools import tool
1. Định nghĩa công cụ miền tùy chỉnh
@tool def add_numbers(a: int, b: int) -> int: """Add two numbers together""" return a + b
2. Khởi tạo Tác nhân CUGA
agent = CugaAgent(tools=[add_numbers])
async def main(): # 3. Áp dụng chính sách Intent Guard theo chương trình await agent.policies.add_intent_guard( name="Block Data Deletion", description="Prevents execution of any destructive delete operations", keywords=["delete", "remove", "wipe"], response="Deletion actions are blocked by enterprise policies.", priority=100 ) # 4. Gọi tác nhân result = await agent.invoke("Add 5000 and 3000") print(result.answer) # Outputs: 8000
if name == "main": asyncio.run(main()) ```
---
Hỗ trợ LLM Đa Nhà cung cấp Mạnh mẽ
CUGA không bị khóa vào bất kỳ mô hình nào. Nó hỗ trợ các mô hình cục bộ và đám mây, với các ưu tiên được cấu hình theo thứ tự: Biến môi trường > Cấu hình TOML > Cấu hình Mặc định:
1. OpenAI / LiteLLM: Sử dụng gpt-4o làm mô hình mặc định. Thiết lập AGENT_SETTING_CONFIG="settings.openai.toml". 2. IBM WatsonX: Sử dụng meta-llama/llama-4-maverick-17b-128e-instruct-fp8 làm mặc định. Thiết lập AGENT_SETTING_CONFIG="settings.watsonx.toml". 3. Azure OpenAI: Cấu hình qua settings.azure.toml với các biến điểm cuối và khóa. 4. Groq / Llama-3.1: Thực thi tốc độ cao bằng cách sử dụng các mô hình mã nguồn mở. Thiết lập AGENT_SETTING_CONFIG="settings.groq.toml".
---
Quản lý Chính sách Doanh nghiệp 🛡️
Một trong những tính năng mạnh mẽ nhất của CUGA là Hệ thống Chính sách khai báo của nó. Nó tách biệt an toàn thời gian chạy, hướng dẫn và định dạng khỏi kỹ thuật nhắc lệnh (prompt engineering). Điều này có nghĩa là các nhà phát triển có thể định nghĩa các quy tắc tổ chức trong một hệ thống tập trung và áp dụng chúng trên bất kỳ LLM nào mà không cần sửa đổi các nhắc lệnh cơ bản: * Intent Guard: Ngăn chặn việc thực thi các nhắc lệnh gây hại trước bất kỳ lời gọi LLM hoặc chuẩn bị công cụ nào. * Playbook: Thực thi các quy trình vận hành tiêu chuẩn (SOP) theo trình tự trên luồng thực thi tác nhân. * Tool Approval: Yêu cầu xác thực rõ ràng của con người trước khi các công cụ rủi ro cao cụ thể được thực thi. * Tool Guide: Hạn chế hoặc hướng dẫn cách thức và thời điểm sử dụng các công cụ cụ thể. * Output Formatter: Phân tích cú pháp, định dạng hoặc lọc an toàn phản hồi đầu ra cuối cùng trước khi hiển thị cho người dùng.
Bằng việc phát hành CUGA dưới giấy phép Apache-2.0 hoàn toàn mã nguồn mở, IBM Research đang cung cấp cho các nhà phát triển một framework tác nhân SOTA, đứng đầu bảng xếp hạng, thu hẹp khoảng cách giữa các nguyên mẫu tác nhân nhanh chóng và các triển khai sản xuất đáng tin cậy, tuân thủ chính sách. Đây là một bước tiến lớn cho ngành AI doanh nghiệp! ✨