Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 17 phút đọc

AI SDK 7: Vercel Nâng Tầm Phát Triển Agent AI với Sức Mạnh Sản Xuất Toàn Diện! 🚀✨

Vercel vừa phát hành AI SDK 7, phiên bản mới nhất của bộ công cụ TypeScript hàng đầu với hơn 16 triệu lượt tải xuống hàng tuần, mang đến khả năng phát triển, vận hành, tích hợp, giám sát tác nhân AI mạnh mẽ hơn cùng hỗ trợ xử lý thời gian thực và tạo video, hướng tới môi trường sản xuất chuyên sâu và độ bền cao. 🌟

Tier 1 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc vercel.com

AI SDK, với hơn 16 triệu lượt tải xuống hàng tuần, là bộ công cụ TypeScript SDK tiêu chuẩn để xây dựng các ứng dụng, tính năng, framework và tác nhân AI (AI Agents) trên mọi nhà cung cấp mô hình. Đây cũng là lớp nền tảng mà eve – framework tác nhân mã nguồn mở của Vercel – được xây dựng.

Với AI SDK 7, Vercel nâng cao đáng kể chiều sâu sản xuất cho công việc với tác nhân AI, tập trung vào năm lĩnh vực chính: * Phát triển tác nhân: Với khả năng kiểm soát suy luận, ngữ cảnh công cụ và runtime, hỗ trợ tệp và kỹ năng nhà cung cấp, MCP Apps, và giao diện người dùng đầu cuối (TUI). * Vận hành tác nhân: Với phê duyệt công cụ, độ bền vững (WorkflowAgent), giới hạn thời gian (timeouts) và hỗ trợ sandbox. * Tích hợp mọi công cụ quản lý tác nhân: Như Codex, Claude Code, Deep Agents, OpenCode, hoặc Pi. * Giám sát tác nhân: Với đo lường từ xa (telemetry), kênh theo dõi Node.js, sự kiện vòng đời và số liệu thống kê hiệu suất. * Vượt ra ngoài tác nhân văn bản: Với hỗ trợ thời gian thực độc lập với nhà cung cấp và khả năng tạo video.

Phát triển Tác nhân AI 🧑‍💻

Việc xây dựng các tác nhân hoạt động tốt đòi hỏi kiểm soát chặt chẽ quá trình suy luận của mô hình, ngữ cảnh công cụ và xử lý tệp.

Kiểm soát suy luận

Hầu hết các mô hình tiên tiến đều hỗ trợ cấu hình suy luận, nhưng mỗi API nhà cung cấp lại có cách triển khai khác nhau. AI SDK 7 chuẩn hóa điều này với tùy chọn reasoning cho generateTextstreamText, cho phép bạn kiểm soát mức độ suy luận chỉ trong một dòng lệnh. Bạn vẫn có thể sử dụng các tùy chọn riêng của nhà cung cấp khi cần cấu hình chi tiết hơn. Tìm hiểu thêm trong tài liệu về suy luận.

Ngữ cảnh công cụ (Tool Context)

Các công cụ ngày càng được phát triển độc lập với các tác nhân hoặc ứng dụng cụ thể. Ví dụ, các công ty bên thứ ba cung cấp công cụ cho phép tác nhân sử dụng API của họ. Do đó, các công cụ này yêu cầu đầu vào bổ sung không được tạo bởi LLM, chẳng hạn như khóa API hoặc cài đặt cấu hình. AI SDK 7 bổ sung một ngữ cảnh công cụ có kiểu dữ liệu đầy đủ, có thể được chỉ định cho mỗi công cụ thông qua một schema. Ngữ cảnh này được giới hạn trong công cụ để ngăn các công cụ của bên thứ 3 truy cập vào ngữ cảnh mà chúng không cần. Tìm hiểu thêm về Ngữ cảnh công cụ.

Ngữ cảnh Runtime

Đối với các vòng lặp tác nhân phức tạp hơn, bạn thường cần các biến mà bạn có thể truy cập và sửa đổi trong prepareStep để điều chỉnh lời nhắc, lựa chọn mô hình và nhiều hơn nữa. AI SDK 7 giới thiệu một ngữ cảnh runtime có kiểu dữ liệu, khả dụng trong quá trình chuẩn bị bước và các hàm phê duyệt công cụ, với hỗ trợ đo lường từ xa tùy chọn. Điều này cho phép bạn đóng gói nhiều logic hơn trong ToolLoopAgent và chia sẻ các tác nhân đó với logic nội bộ. Tìm hiểu thêm về Ngữ cảnh Runtime.

Tải lên tệp nhà cung cấp (Provider File Uploads)

Nhiều quy trình làm việc của tác nhân yêu cầu xử lý các đầu vào lớn, như PDF, hình ảnh, tập dữ liệu hoặc các hiện vật khác. Gửi các tệp này trực tiếp vừa chậm vừa lãng phí, đặc biệt đối với suy luận không trạng thái, nơi chúng được gửi đi gửi lại nhiều lần. AI SDK 7 bổ sung API uploadFile cấp cao nhất cho phép bạn tải lên một tệp một lần và sau đó truyền một tham chiếu nhẹ vào các lệnh gọi mô hình tiếp theo. Điều này tránh việc tải lại cùng một byte nhiều lần, giúp suy luận nhanh hơn và tiết kiệm băng thông trong các lần chạy lặp lại hoặc nhiều bước. uploadFile có thể được sử dụng với bất kỳ nhà cung cấp nào cung cấp điểm cuối tải lên tệp. Hàm này trả về một đối tượng tham chiếu nhà cung cấp có thể di động giữa các nhà cung cấp. Tìm hiểu thêm về Tải lên tệp nhà cung cấp.

Tải lên kỹ năng nhà cung cấp (Provider Skill Uploads)

Gửi kỹ năng trực tiếp trong mọi yêu cầu tới môi trường container do nhà cung cấp quản lý cũng gặp vấn đề tương tự như gửi tệp trực tiếp. AI SDK 7 bổ sung API uploadSkill cấp cao nhất cho phép bạn tải lên một kỹ năng một lần và sau đó sử dụng tham chiếu đến nó trong các lệnh gọi suy luận tiếp theo. Tương tự như uploadFile, hàm này trả về một đối tượng tham chiếu nhà cung cấp. Tìm hiểu thêm về Tải lên kỹ năng nhà cung cấp.

MCP Apps

MCP (Model-Connected Programs) đã trở thành một cách phổ biến để kết nối các tác nhân với các công cụ và tài nguyên. Tuy nhiên, không phải mọi công cụ đều cần hiển thị với mô hình, và một số máy chủ MCP cần hiển thị giao diện người dùng chuyên biệt cùng với các công cụ của họ. AI SDK 7 bổ sung hỗ trợ cho MCP Apps. Các máy chủ MCP giờ đây có thể tách biệt các công cụ hiển thị với mô hình khỏi các công cụ chỉ dành cho ứng dụng, bảo toàn siêu dữ liệu ứng dụng và hiển thị giao diện người dùng ứng dụng bên trong các iframe được sandbox. Một cầu nối JSON-RPC kết nối các công cụ, tài nguyên và tương tác hiển thị. Điều này cho phép bạn xây dựng trải nghiệm tác nhân phong phú hơn, nơi mô hình có thể sử dụng các công cụ cần thiết, trong khi người dùng thấy giao diện dành riêng cho ứng dụng để xem xét, cấu hình hoặc tương tác. Bắt đầu xây dựng Ứng dụng MCP đầu tiên của bạn với AI SDK ngay hôm nay.

Giao diện người dùng đầu cuối (TUI)

Khi phát triển tác nhân, bạn cần có khả năng kiểm tra nhanh chóng mà không cần viết một ứng dụng đầy đủ. AI SDK 7 bổ sung một gói giao diện người dùng đầu cuối (TUI) cho phép bạn chạy tác nhân chỉ với vài dòng mã: TUI có tính tương tác, hỗ trợ suy luận và công cụ, đồng thời hiển thị Markdown dưới dạng văn bản được định dạng. Tìm hiểu thêm về việc tạo tác nhân đầu cuối của riêng bạn.

Vận hành Tác nhân AI ⚙️

Khi các tác nhân trở nên tự động và chạy lâu hơn, nhu cầu về phê duyệt, độ bền vững, sandboxing và độ tin cậy ngày càng tăng.

Phê duyệt công cụ (Tool Approvals)

AI SDK 7 hỗ trợ phê duyệt công cụ ở cấp độ tác nhân có thể tự động hoặc cần sự can thiệp của con người, với các loại phê duyệt sau: * user-approval đơn giản cho các công cụ cụ thể. * Hàm phê duyệt công cụ cho một công cụ cụ thể có thể tự động phê duyệt, tự động từ chối hoặc chuyển tiếp tới phê duyệt của người dùng. * Hàm phê duyệt công cụ chung, bao trùm. Phê duyệt công cụ được định nghĩa trên ToolLoopAgent, generateTextstreamText, vì kịch bản sử dụng của một công cụ cụ thể thúc đẩy nhu cầu phê duyệt. Đối với các quy trình làm việc có rủi ro cao hơn, AI SDK 7 giới thiệu phê duyệt công cụ được ký bằng HMAC tùy chọn để ngăn chặn các phê duyệt giả mạo. SDK cũng tăng cường hành vi phát lại bằng cách xác thực lại các đầu vào và chính sách công cụ trước khi tiếp tục thực thi. Xem cách phê duyệt công cụ hoạt động.

WorkflowAgent (Độ bền vững) 💾

Khi một tác nhân chạy qua nhiều bước hoặc chờ phê duyệt của con người, việc khởi động lại hoặc triển khai lại giữa chừng có nghĩa là phải bắt đầu lại từ đầu. AI SDK 7 giới thiệu @ai-sdk/workflowWorkflowAgent cho việc thực thi tác nhân bền vững, có thể tiếp tục lại sau khi khởi động lại tiến trình, triển khai, gián đoạn và phê duyệt bị trì hoãn. WorkflowAgent hỗ trợ streaming dựa trên workflow, công cụ, phê duyệt, callbacks, prepareCall, và serialize mô hình nhà cung cấp qua các ranh giới bước workflow. Nó cũng hỗ trợ ngữ cảnh runtime có kiểu dữ liệu cho trạng thái tác nhân dùng chung và đo lường từ xa ổn định. Callbacks giờ đây bao gồm dữ liệu thực thi phong phú hơn như số bước, kết quả trước đó, thời lượng và thông tin thành công hoặc thất bại. Các lệnh gọi công cụ không hợp lệ được giữ nguyên mà không thực thi các công cụ không hợp lệ, và chuyển đổi toModelOutput của công cụ có thể giữ lại các đầu ra thô cho UI và callbacks. Tìm hiểu cách xây dựng một tác nhân với WorkflowAgent.

Giới hạn thời gian (Timeouts) ⏳

Các tác nhân có thể bị đình trệ theo nhiều cách hơn so với một yêu cầu đơn giản: một nhà cung cấp có thể mở một luồng và ngừng gửi các khối dữ liệu, một công cụ có thể bị treo, hoặc một lần chạy nhiều bước có thể vượt quá tổng ngân sách của nó. AI SDK 7 bổ sung cấu hình giới hạn thời gian hạng nhất trên các API tạo văn bản và tác nhân, bao gồm tổng thời gian, thời gian cho mỗi bước, mỗi khối và mỗi công cụ. Việc hủy bỏ do hết thời gian sử dụng TimeoutError, và các lý do hủy bỏ được truyền qua các giao thức luồng và UI. Tìm hiểu thêm về giới hạn thời gian.

Hỗ trợ Sandbox

Các tác nhân chạy lệnh shell, đọc và ghi tệp, hoặc thực thi mã được tạo cần một môi trường thực thi nhất quán, nhưng sandbox cơ bản thường thay đổi giữa môi trường phát triển cục bộ, CI và sản xuất. AI SDK 7 bổ sung một trừu tượng SandboxSession hạng nhất để thực thi lệnh di động trong các công cụ và tác nhân. Các công cụ có thể được phát triển độc lập với bất kỳ sandbox cụ thể nào, và bạn có thể sử dụng bất kỳ công cụ nào có hỗ trợ sandbox với bất kỳ nhà cung cấp sandbox nào. Các môi trường sandbox, như Vercel Sandbox, là lý tưởng cho mục đích này.

Tích hợp mọi Công cụ Quản lý Tác nhân 🔗

Các runtime tác nhân đang vượt ra ngoài một máy chủ ứng dụng duy nhất. Các nhóm muốn chạy cùng một logic tác nhân trong môi trường mã hóa, sandbox được lưu trữ, phiên cục bộ và các công cụ quản lý của bên thứ ba.

HarnessAgent

AI SDK 7 giới thiệu các trừu tượng harness thử nghiệm và HarnessAgent: một API để chạy các công cụ quản lý tác nhân đã được cấu hình đầy đủ và thiết lập như Claude Code, Codex và Pi. Các harness có thể được cấu hình với một sandbox để hoạt động, các hướng dẫn tùy chỉnh, kỹ năng và công cụ. Chạy các harness đã được thiết lập thông qua một giao diện nhất quán, cấu hình từng harness độc lập và hoán đổi một harness mà không thay đổi lớp tích hợp của bạn. Bên dưới, trừu tượng này bao gồm một đặc tả bộ chuyển đổi v1, hỗ trợ cầu nối và các nguyên thủy phiên sandbox mở rộng để tạo và tiếp tục phiên. Các phiên harness có thể được tạm dừng và tiếp tục, và thậm chí các lượt cá nhân có thể bị gián đoạn và tiếp tục giữa chừng. HarnessAgent triển khai giao diện Agent của AI SDK, vì vậy các giá trị trả về generatestream của nó hoàn toàn tương thích với các tích hợp AI SDK hiện có, và useChat() cùng TUI mới hoạt động mà không cần thêm bất kỳ dây nối nào. Tìm hiểu thêm về AI SDK Harnesses.

Giám sát Tác nhân AI 📈

Việc hiểu cách các tác nhân của bạn hoạt động trong môi trường sản xuất là một thách thức. AI SDK 7 biến khả năng giám sát thành một phần hạng nhất của việc xây dựng tác nhân.

Đo lường từ xa (Telemetry) 📊

AI SDK 7 đã được cải tiến đo lường từ xa xung quanh một hệ thống tích hợp duy nhất, có khả năng mở rộng. Thay vì nối các callback vòng đời vào mọi lệnh gọi generateText hoặc streamText, hãy đăng ký đo lường từ xa một lần khi khởi động ứng dụng: Thiết kế lại bao gồm: * Các giao diện đo lường từ xa chuyên dụng cho tích hợp nhà cung cấp bên thứ 3. * Phạm vi bao phủ toàn cầu của tất cả các hàm AI SDK với một lần đăng ký duy nhất. * Tích hợp OpenTelemetry tùy chọn sử dụng các quy ước ngữ nghĩa GenAI mới nhất. * Hỗ trợ kênh theo dõi Node.js. Các tích hợp khả năng quan sát: Datadog, Langfuse, Braintrust, Raindrop, Sentry, Laminar, Langsmith. Các dấu vết giờ đây nắm bắt được toàn bộ hình dạng của một hoạt động AI, bao gồm quá trình tạo gốc, mỗi lệnh gọi mô hình, các bước riêng lẻ, thực thi công cụ, embeddings, reranking, sử dụng, lỗi và ngữ cảnh runtime hoặc công cụ đã chọn. Bạn có thể tìm thêm chi tiết trong tài liệu AI SDK Telemetry.

Kênh theo dõi Node.js

AI SDK 7 bổ sung hỗ trợ cho các kênh theo dõi Node.js thông qua node:diagnostics_channel. SDK phát ra các sự kiện đo lường từ xa có cấu trúc trên kênh ai:telemetry cho generateText, streamText, các lệnh gọi mô hình, thực thi công cụ, embeddings và reranking. Một nhà cung cấp khả năng quan sát có thể đăng ký một lần thông qua gói công cụ của mình và tự động chuyển đổi hoạt động AI SDK thành các dấu vết, bảo toàn ngữ cảnh bất đồng bộ trên các phản hồi streaming và lệnh gọi công cụ. Bạn có thể tìm hiểu thêm trong tài liệu về kênh theo dõi.

Thống kê hiệu suất

AI SDK 7 bổ sung thống kê hiệu suất theo từng bước cho đầu ra mô hình, hành vi streaming và thực thi công cụ. Bạn có thể trả lời các câu hỏi như: Mất bao lâu để mô hình bắt đầu phản hồi? Tốc độ các token đến là bao nhiêu? Công cụ nào mất nhiều thời gian nhất? Tìm hiểu thêm về thống kê hiệu suất.

Sự kiện vòng đời (Lifecycle events)

Các tác nhân sản xuất cần các hook vòng đời vì việc ghi lại trạng thái, thanh toán và gỡ lỗi đều phụ thuộc vào việc biết chính xác khi nào các lần chạy, bước và công cụ bắt đầu và kết thúc. AI SDK 7 làm cho các callback được kích hoạt nhất quán trên các lệnh gọi mô hình, tác nhân, công cụ và các hàm khác, để bạn có thể quan sát khi mỗi cái bắt đầu, mô hình nào đã chạy, có bao nhiêu token đã sử dụng và nó kết thúc như thế nào. Bạn có thể tìm thêm chi tiết trong tài liệu Lifecycle Callbacks.

Vượt ra ngoài Tác nhân Văn bản 🌐

Các ứng dụng AI đang mở rộng ngoài văn bản và hình ảnh.

Hỗ trợ thời gian thực độc lập với nhà cung cấp

Các API mô hình thời gian thực rất mạnh mẽ, nhưng mỗi nhà cung cấp lại hiển thị các phiên, âm thanh, công cụ và xác thực trình duyệt khác nhau. AI SDK 7 bổ sung hỗ trợ thời gian thực độc lập với nhà cung cấp (thử nghiệm) cho các phiên WebSocket trực tiếp của trình duyệt. SDK hỗ trợ các token tạm thời do máy chủ tạo, triển khai nhà cung cấp cho OpenAI, Google và xAI, và một hook React thời gian thực trả về UIMessage[]. Các phiên thời gian thực hỗ trợ chuyển đổi giọng nói thành văn bản (audio transcription) và gọi công cụ do client điều khiển, vì vậy bạn có thể xây dựng các tác nhân giọng nói, copilots cộng tác và giao diện tương tác độ trễ thấp mà không ràng buộc giao diện người dùng của bạn với định dạng sự kiện của một nhà cung cấp. AI Gateway cũng hỗ trợ các phiên thời gian thực được chuẩn hóa thông qua gateway.experimental_realtime(), bao gồm xác thực subprotocol WebSocket, lựa chọn truy vấn mô hình và các tùy chọn nhà cung cấp được xác thực. Tìm hiểu thêm về thời gian thực.

Tạo video 🎬

AI SDK 7 giới thiệu hỗ trợ generateVideo (thử nghiệm) với các triển khai nhà cung cấp cho fal, Google AI Studio, Google Vertex và Replicate. Tạo video trong AI SDK 7 sử dụng độ phân giải mô hình dành riêng cho video, hỗ trợ tìm kiếm mô hình dựa trên chuỗi thông qua nhà cung cấp mặc định và bao gồm xử lý tải xuống an toàn hơn với giới hạn kích thước có thể cấu hình và hỗ trợ hủy bỏ. Tìm hiểu thêm về tạo video.

Bắt đầu ngay! 🚀

Cài đặt AI SDK 7 chỉ với một lệnh. * Bắt đầu với AI SDK 7 * Xem toàn bộ changelog * Di chuyển sang v7 * Tham gia cộng đồng

AI SDK 7 là kết quả của sự hợp tác giữa đội ngũ cốt lõi tại Vercel (Gregor, Lars, Felix, Aayush, Josh, Nico) và cộng đồng đóng góp tuyệt vời của chúng tôi. Phản hồi, báo cáo lỗi và các pull request của bạn trên GitHub là công cụ định hình bản phát hành này. Chúng tôi rất hào hứng mong đợi những gì bạn sẽ xây dựng với các khả năng mới này!