Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 10 phút đọc

AI SDK 7 Ra Mắt: Biến TypeScript Thành Nền Tảng Phát Triển Agent AI Toàn Diện, Đa Phương Tiện! 🚀✨

Vercel vừa phát hành AI SDK 7, một bản cập nhật lớn biến SDK này từ một công cụ gọi mô hình đơn thuần thành một nền tảng tác nhân (agent) AI mạnh mẽ và toàn diện, hỗ trợ phát triển, vận hành, tích hợp và quan sát tác nhân trên đa dạng định dạng từ văn bản, âm thanh đến video, mang lại bước tiến đột phá cho các nhà phát triển TypeScript.

Tier 1 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc vercel.com

Vercel đã chính thức công bố AI SDK 7, một bản phát hành quan trọng đánh dấu sự chuyển mình mạnh mẽ của bộ công cụ này. Ban đầu, AI SDK chỉ tập trung vào các lệnh gọi mô hình và chức năng chat cơ bản. Giờ đây, nó đã phát triển thành một nền tảng tác nhân (agent) AI toàn diện, cho phép các nhà phát triển xây dựng, vận hành, tích hợp và quan sát tác nhân trên nhiều phương tiện như văn bản, âm thanh, hình ảnh và video, đưa TypeScript lên một tầm cao mới trong lĩnh vực AI. Mọi nhà cung cấp lớn đều được hỗ trợ sẵn có, mở ra vô vàn khả năng mới. 💡

Các Điểm Nhấn Chính của AI SDK 7 🚀

Bản cập nhật này mang đến nhiều cải tiến vượt trội, gói gọn trong các lĩnh vực sau: * Phát triển tác nhân: Hỗ trợ kiểm soát logic suy luận, ngữ cảnh công cụ và runtime, tải tệp và kỹ năng từ nhà cung cấp, MCP Apps, và giao diện người dùng terminal (TUI). * Vận hành tác nhân: Cải thiện quy trình phê duyệt công cụ, thực thi bền bỉ với WorkflowAgent, quản lý thời gian chờ (timeout) nâng cao và hỗ trợ môi trường sandbox. * Tích hợp nền tảng tác nhân: Dễ dàng kết nối với các "harness" tác nhân phổ biến như Codex, Claude Code, Deep Agents, OpenCode hay Pi. * Quan sát hành vi tác nhân: Hệ thống telemetry được thiết kế lại, gói @ai-sdk/otel chuyên dụng, hỗ trợ Node.js tracing channel, callback vòng đời và thống kê hiệu suất theo từng bước. * Xây dựng đa phương tiện: Các API ổn định cho giọng nói/chuyển văn bản, phần tệp tin phong phú hơn, tạo và chỉnh sửa hình ảnh, nhúng đa phương thức (multimodal embeddings), reranking, giọng nói thời gian thực (thử nghiệm) và tạo video (thử nghiệm). * Nâng cấp với API rõ ràng hơn: Hướng dẫn di chuyển mới, codemods và lộ trình nâng cấp cho ESM, Node.js 22 cùng nhiều API khác.

Lưu Ý Quan Trọng Trước Khi Nâng Cấp ⚠️

AI SDK 7 giới thiệu hai yêu cầu bắt buộc, có thể gây ảnh hưởng lớn đến quá trình nâng cấp của bạn: * Yêu cầu Node.js 22 trở lên: SDK này phụ thuộc vào các API mới (bao gồm triển khai fetch gốc và ngữ nghĩa AsyncLocalStorage cải tiến) không được hỗ trợ trên các phiên bản LTS cũ hơn. * Bắt buộc sử dụng ESM imports: AI SDK 7 yêu cầu cú pháp import (hoặc tệp .mjs). require() của CommonJS không còn được hỗ trợ. Bạn cần cập nhật package.json với "type": "module" hoặc chuyển đổi các tệp riêng lẻ sang .mjs.

Để tự động hóa phần lớn các thay đổi về import và đổi tên, hãy chạy các codemods của v7 trước khi xem xét các mục di chuyển ngữ nghĩa theo cách thủ công. Tham khảo hướng dẫn di chuyển đầy đủ v7 để biết thêm chi tiết. 🛠️

Phát Triển Tác Nhân Thông Minh Hơn 🧠

AI SDK 7 cung cấp các công cụ mạnh mẽ để xây dựng tác nhân phức tạp: * Kiểm soát suy luận độc lập với nhà cung cấp: Các hàm generateTextstreamText giờ đây hỗ trợ tùy chọn reasoning cấp cao nhất, ánh xạ tới các cài đặt gốc của nhà cung cấp như OpenAI, Anthropic, Google, và nhiều hơn nữa. * Ngữ cảnh runtime có kiểu dữ liệu: Trạng thái điều phối chung nằm trong runtimeContext và được truyền qua các hàm, callback vòng đời và telemetry. * Ngữ cảnh công cụ được phân vùng: Các công cụ có thể khai báo contextSchema, cho phép người gọi cung cấp giá trị riêng cho từng công cụ, đảm bảo chỉ những thông tin cần thiết mới được truyền đi.

Vận Hành Tác Nhân Ổn Định Trong Môi Trường Sản Xuất 🏭

SDK 7 bổ sung các tính năng cốt lõi giúp tác nhân sẵn sàng cho môi trường sản phẩm: * Phê duyệt công cụ an toàn: generateText, streamText, và ToolLoopAgent có thể định nghĩa chính sách phê duyệt, yêu cầu người dùng chấp thuận, tự động phê duyệt/từ chối hoặc ủy quyền cho các hàm phê duyệt có kiểu. * Thực thi bền bỉ với WorkflowAgent: Gói @ai-sdk/workflow giới thiệu WorkflowAgent cho các tác nhân chạy dài hạn. Trạng thái thực thi được lưu trữ vào bộ nhớ bền vững giữa các bước, giúp tác nhân sống sót qua các lần triển khai, khởi động lại tiến trình hoặc phê duyệt bị trì hoãn. * Quản lý thời gian chờ nâng cao: Các API tạo văn bản và tác nhân có thể xác định các ngưỡng thời gian chờ tổng thể, theo từng bước hoặc theo công cụ, với lỗi TimeoutError rõ ràng. * Thực thi trong Sandbox: Hỗ trợ môi trường sandbox cho các lệnh, đầu ra luồng, thư mục làm việc và biến môi trường.

Dễ Dàng Tích Hợp Các Nền Tảng Tác Nhân Khác 🤝

AI SDK 7 giới thiệu một lớp "harness" để đưa các tác nhân mã hóa hiện có vào hệ sinh thái AI SDK: * HarnessAgent: Chạy các "harness" tác nhân bên ngoài thông qua giao diện Agent của AI SDK. * Adapters cho tác nhân mã hóa: Các bộ điều hợp cho Claude Code, Codex, và Pi cho phép tích hợp các runtime tác nhân hiện có vào ứng dụng AI SDK.

Quan Sát Hành Vi Tác Nhân Một Cách Toàn Diện 📊

Khả năng quan sát đã được cải thiện đáng kể: * Tích hợp telemetry toàn cầu: Đăng ký telemetry một lần và nhận các sự kiện có cấu trúc trên các lệnh gọi mô hình, bước, công cụ, nhúng và thực thi tác nhân. * Gói OpenTelemetry chuyên dụng: Hỗ trợ OpenTelemetry giờ đây nằm trong @ai-sdk/otel, với các span và metric theo quy ước ngữ nghĩa GenAI. * Thống kê hiệu suất chi tiết: Kết quả từng bước hiển thị các chỉ số thời gian và thông lượng, bao gồm thời gian phản hồi, tổng thời gian bước và tốc độ tạo token đầu ra.

Vượt Ra Ngoài Văn Bản: Xây Dựng Ứng Dụng Đa Phương Tiện 📸🔊

AI SDK 7 mở rộng khả năng của mình sang thời gian thực, video, giọng nói, hình ảnh và nhúng: * Thời gian thực (thử nghiệm): Phiên WebSocket từ trình duyệt đến nhà cung cấp cho OpenAI, Google, và xAI, với các cuộc trò chuyện âm thanh/văn bản và các lệnh gọi công cụ từ phía client. * Tạo video (thử nghiệm): Hỗ trợ tạo video qua nhiều nhà cung cấp như Google AI Studio, Replicate, và xAI. * API giọng nói và chuyển văn bản ổn định: Các API generateSpeech, transcribe, SpeechResultTranscriptionResult đã ổn định. * Hình ảnh dưới dạng tệp: Hình ảnh giờ đây tuân theo mô hình tệp tin chuẩn, cho phép xử lý nhất quán dữ liệu nội tuyến, URL và tham chiếu nhà cung cấp.

Cải Tiến Giao Diện Người Dùng, Luồng Dữ Liệu và Xử Lý Tin Nhắn 💬

Bản v7 tập trung vào việc làm cho các luồng tác nhân trở nên chính xác, dễ kết hợp và đáng tin cậy hơn: * Truyền tải tác nhân trực tiếp: DirectChatTransport có thể gọi một Agent trực tiếp từ mã UI. * Phê duyệt công cụ trong luồng UI: Tin nhắn UI hỗ trợ phản hồi phê duyệt tự động. * Luồng đáng tin cậy hơn: Các luồng nhà cung cấp kết thúc trước chunk cuối cùng sẽ được coi là lỗi, lỗi thực thi công cụ được phát ra và dọn dẹp một cách dự đoán.

Những Thay Đổi Đáng Chú Ý Khác 🚨

AI SDK 7 cũng mang đến một số thay đổi quan trọng khác mà nhà phát triển cần lưu ý: * Thăng cấp từ thử nghiệm: Nhiều API trước đây ở trạng thái experimental_ đã trở thành API chính thức, như customProvider, generateImage, output, prepareStep, và telemetry. * Đổi tên API: Tùy chọn system giờ là instructions, onFinish thành onEnd, và StreamTextResult.fullStream thành stream. * API bị phản đối (Deprecated): needsApproval trên tool()dynamicTool() đã bị phản đối, thay vào đó nên sử dụng toolApproval ở cấp cao hơn. Các helper phản hồi luồng như result.toUIMessageStreamResponse() cũng được thay thế bằng các helper cấp cao hơn. * Cấu hình suy luận tập trung: Tùy chọn reasoning cấp cao nhất thay thế các cài đặt suy luận cụ thể của nhà cung cấp. * OpenTelemetry chuyển sang gói riêng: Hỗ trợ OpenTelemetry không còn tích hợp sẵn trong gói ai mà nằm trong @ai-sdk/otel. * Kết quả đa bước đại diện cho toàn bộ quá trình: Các thuộc tính usage, content, tool calls/results, files, sources, và warnings giờ đây tích lũy qua tất cả các bước; dữ liệu chỉ dành cho bước cuối cùng nằm dưới finalStep.

Lộ Trình Nâng Cấp Lên AI SDK 7 🛣️

Để di chuyển dự án hiện có sang AI SDK 7, hãy làm theo các bước sau: 1. Cập nhật Node.js lên 22+: Đảm bảo môi trường runtime và CI của bạn đáp ứng yêu cầu tối thiểu. 2. Cập nhật các gói: Nâng cấp ai và tất cả các gói @ai-sdk/* lên phiên bản v7 trong package.json. 3. Chạy các codemods của v7: Các codemods sẽ tự động hóa phần lớn các thay đổi về đổi tên, import và di chuyển API. Hãy xem lại diff trước khi commit. 4. Di chuyển OpenTelemetry: Nếu bạn sử dụng tracing, hãy chuyển thiết lập của mình sang @ai-sdk/otel và đăng ký telemetry toàn cầu. 5. Kiểm tra thủ công các thay đổi ngữ nghĩa: Codemods không thể quyết định hoàn toàn các yêu cầu runtime, import ESM, hành vi instruction/message, tách biệt ngữ cảnh runtime/tool, vị trí chính sách phê duyệt và hình dạng kết quả đa bước. Tham khảo hướng dẫn di chuyển đầy đủ v7 để biết chi tiết.

Để có một quá trình di chuyển có hướng dẫn, hãy cài đặt skill di chuyển AI SDK v7 và yêu cầu tác nhân của bạn áp dụng nó vào ứng dụng. ✨