Hugging Face, cái tên quen thuộc trong cộng đồng AI, vừa công bố một bản cập nhật lớn mang tên "Agents on the Hub" (Các Agent trên Hub). Đây không chỉ là một tính năng mới mà là một bước tiến đáng kể trong việc tích hợp các agent AI vào hệ sinh thái của họ, với sự hỗ trợ gốc cho giao thức Model Context Protocol (MCP), các kỹ năng agent và đặc biệt là một trình xem dấu vết chuyên dụng ngay trên Hugging Face Hub. 🤯
Điểm nhấn đáng chú ý là sự hỗ trợ tích hợp cho Dấu vết Agent (Agent Traces) từ các agent phát triển dựa trên terminal như Claude Code của Anthropic, OpenAI's Codex, và Pi Agent. Để giúp việc đồng bộ hóa các dấu vết phiên làm việc này trở nên liền mạch, Hugging Face đã bổ sung lệnh hf sync (một bí danh tiện lợi cho hf buckets sync) vào giao diện dòng lệnh (CLI) hf chính thức của họ. Điều này mở ra khả năng mới để các nhà phát triển theo dõi và phân tích sâu hơn quá trình làm việc của AI agent. ✨
Nguồn: https://x.com/RisingSayak/status/2067174158451331566
"Agents on the Hub" của Hugging Face là gì?
"Agents on the Hub" cung cấp một bộ công cụ và giao thức thống nhất, kết nối trực tiếp các agent AI với các mô hình, tập dữ liệu (datasets), Spaces và tài nguyên cộng đồng trên Hugging Face Hub. Các tính năng chính bao gồm:
* CLI của Hugging Face dành cho Agent AI: Cung cấp cho agent của bạn công cụ hf CLI với các kỹ năng tích hợp sẵn. * Máy chủ MCP của Hugging Face: Máy chủ Giao thức Ngữ cảnh Mô hình (MCP) tiêu chuẩn hóa, cho phép bất kỳ máy khách tương thích nào (bao gồm Claude Desktop, Cursor, VS Code và ChatGPT) tương tác với Hub. * Kỹ năng Agent (Agent Skills): Các hướng dẫn được xây dựng sẵn, dành riêng cho từng tác vụ trong quy trình làm việc AI/ML mà các agent lập trình có thể sử dụng. * Dấu vết Agent (Agent Traces): Trình xem dấu vết chuyên dụng để xem lại, trực quan hóa và chia sẻ lịch sử thực thi của agent.
Sức Mạnh của `hf sync` và Dấu Vết Agent 📊
Các agent lập trình cục bộ thường ghi lại lịch sử phiên làm việc của chúng (dưới dạng dấu vết JSONL) vào các thư mục cụ thể trên máy tính: * Claude Code: ~/.claude/projects * Codex: ~/.codex/sessions * Pi Agent: ~/.pi/agent/sessions
Các tệp dấu vết này ghi lại ngữ cảnh phong phú của các lần chạy agent, bao gồm lời nhắc của người dùng, các bước suy luận của LLM, đầu vào/đầu ra của công cụ, đầu ra lệnh terminal, đường dẫn tệp cục bộ và thậm chí cả ảnh chụp màn hình. Đây là một kho dữ liệu quý giá để phân tích hành vi của agent.
Với hf CLI mới nhất, các nhà phát triển có thể sử dụng công cụ hf sync mới (hoặc hf buckets sync / hf upload) để tải trực tiếp các dấu vết JSONL thô này lên một Hugging Face Dataset hoặc một Storage Bucket. Sau khi tải lên, Hugging Face Hub sẽ hiển thị chúng trong một giao diện Trình xem Dấu vết chuyên dụng, cung cấp một cách trực quan, có cấu trúc để phân tích quá trình ra quyết định của agent, gỡ lỗi khi gặp sự cố và chia sẻ các lần chạy hoạt động. Thật tiện lợi! 🎉
Cách Đồng Bộ và Xem Dấu Vết Agent:
1. Cài đặt hf CLI: bash curl -LsSf https://hf.co/cli/install.sh | bash hf auth login hf skills add 2. Đồng bộ hóa dấu vết Claude Code vào một storage bucket của Hugging Face: bash hf sync ~/.claude/projects hf://buckets/<tên_người_dùng>/<tên_bucket>/claude 3. Đồng bộ hóa các phiên Codex vào một Dataset: bash hf upload <tên_người_dùng>/<tên_dataset> ~/.codex/sessions . --repo-type dataset
Data Studio của Hugging Face Hub sẽ hiển thị các dấu vết dựa trên dataset, trong khi các storage bucket cho phép xem từng tệp .jsonl trực tiếp trong trình xem dấu vết trên trình duyệt.
Những Lưu Ý Quan Trọng ⚠️
Vì các dấu vết agent ghi lại đầu vào và đầu ra của terminal, chúng có thể chứa dữ liệu nhạy cảm như: * Khóa API và mã thông báo (tokens) * Đường dẫn hệ thống tệp cục bộ * Các đoạn mã riêng tư * Thông tin đăng nhập hoặc chi tiết cá nhân
Các nhà phát triển được khuyến cáo nên xem xét và biên tập (redact) các dấu vết trước khi tải chúng lên các tập dữ liệu/bucket công khai, hoặc sử dụng các kho lưu trữ riêng tư. Đối với Pi Agent, các công cụ như pi-share-hf có thể tự động thu thập, che giấu bí mật (thông qua TruffleHog và đánh giá của LLM), và chỉ tải lên các dấu vết an toàn. Đây là một bước quan trọng để đảm bảo an toàn thông tin khi khai thác tiềm năng của "Agents on the Hub". 🔐