Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 5 phút đọc

Google Đẩy Mạnh Interactions API Làm Chuẩn Mới Cho Gemini: Tương Lai Của Tác Tử AI Đã Đến! 🚀🤖

Google DeepMind đã chính thức công bố Interactions API sẽ là giao diện mặc định mới cho các mô hình và tác tử Gemini, thay thế API `generateContent` cũ để hỗ trợ hiệu quả hơn cho các tác vụ AI phức tạp và phát triển tác tử tự động.

Tier 1 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc the-decoder.com

Google DeepMind vừa chính thức tuyên bố Interactions API là giao diện mặc định được khuyến nghị cho tất cả các mô hình và tác tử Gemini. Đây là một sự chuyển đổi quan trọng từ API generateContent vốn đã là tiêu chuẩn tương tác với Gemini kể từ khi ra mắt. Kể từ tháng 6 năm 2026, Interactions API đã đạt trạng thái Sẵn sàng Phổ biến (GA) và được chỉ định là con đường tích hợp ưu tiên cho tất cả các dự án phần mềm mới và kiến trúc tác tử. Mặc dù API generateContent ban đầu vẫn được hỗ trợ đầy đủ để đảm bảo tính tương thích ngược, nhưng tất cả các khả năng tác tử mới và cập nhật tính năng sẽ chỉ được cung cấp độc quyền thông qua Interactions API mới.

Vì Sao Google Lại Chuyển Đổi Sang Interactions API?

API generateContent được xây dựng cho việc tạo văn bản đơn giản, không trạng thái, một hoặc nhiều lượt. Tuy nhiên, khi bối cảnh AI nhanh chóng chuyển dịch sang các tác tử tự động đa phương thức, phức tạp, các điểm cuối không trạng thái đã trở thành một nút thắt cổ chai lớn. Các nhà phát triển phải tự quản lý toàn bộ lịch sử hội thoại, nhật ký thực thi công cụ và đồng bộ hóa trạng thái ở phía client.

Interactions API mới giải quyết những thách thức này bằng cách giới thiệu các tính năng tích hợp sẵn, cấp nền tảng được tối ưu hóa cho quy trình làm việc của tác tử:

1. Quản lý Trạng thái Hội thoại Phía Máy Chủ: Theo mặc định, Interactions API tự động lưu giữ và quản lý lịch sử hội thoại. Các nhà phát triển có thể dễ dàng nối tiếp các lượt tương tác bằng cách tham chiếu một previous_interaction_id, loại bỏ hoàn toàn nhu cầu truyền toàn bộ lịch sử trò chuyện trong mỗi yêu cầu. Nhà phát triển cũng có thể chọn không theo dõi trạng thái bằng cách đặt store=false. 2. Các Bước Thực thi Có Thể Quan Sát Được: API cung cấp khả năng hiển thị chi tiết, có cấu trúc về các bước thực thi nội bộ của mô hình (ví dụ: lập kế hoạch, suy luận, gọi công cụ và thực thi). Điều này giúp việc gỡ lỗi hành vi tác tử trở nên dễ dàng hơn đáng kể và cho phép các ứng dụng giao diện người dùng hiển thị các bước thực thi trực tiếp cho người dùng. 3. Thực thi Nền: Đối với các luồng công việc tác tử dài hạn, nhiều bước (như nghiên cứu chuyên sâu hoặc các tác vụ lập trình phức tạp), nhà phát triển có thể thực thi các tác vụ bất đồng bộ ở chế độ nền bằng cách đặt background=true. 4. Lược đồ Đơn giản hóa: Thay thế các cấu trúc tin nhắn cũ, dài dòng, dựa trên vai trò (người dùng/mô hình/hệ thống), Interactions API sử dụng một lược đồ bước có kiểu được sắp xếp hợp lý, phù hợp tự nhiên với các vòng lặp hành động của tác tử.

Hỗ Trợ SDK & Tích Hợp

Interactions API được hỗ trợ trong các phiên bản mới nhất của Google GenAI SDK chính thức:

* Python: Được hỗ trợ trong gói google-genai bắt đầu từ phiên bản 1.55.0 trở lên. * JavaScript/TypeScript: Được hỗ trợ trong gói @google/genai bắt đầu từ phiên bản 1.33.0 trở lên.

Để giúp các nhà phát triển chuyển đổi tích hợp hiện có, Google đã phát hành Hướng dẫn Di chuyển chuyên dụng, trình bày chi tiết cách ánh xạ các cấu trúc generateContent cũ sang lược đồ bước có kiểu của Interactions API.

Hãy cùng xem sự khác biệt cơ bản về cách xử lý một cuộc hội thoại đa lượt giữa hai API này. Với generateContent truyền thống, nhà phát triển phải tự tay thu thập và truyền toàn bộ lịch sử hội thoại trong mỗi yêu cầu. Ngược lại, Interactions API mới đơn giản hóa đáng kể quy trình này; bạn chỉ cần tham chiếu interaction_id từ lượt tương tác trước đó, cho phép API quản lý trạng thái hội thoại ở phía máy chủ một cách hiệu quả.

Các Mô Hình Được Hỗ Trợ & Hạn Chế Hiện Tại

Tại thời điểm ra mắt GA, Interactions API hoàn toàn tương thích với các mô hình tiên phong hàng đầu của Google và các nền tảng tác tử chuyên biệt:

* gemini-3.1-flash-lite * gemini-3.1-flash-lite-preview * gemini-3.1-pro-preview * gemini-2.5-pro

Hạn chế hiện tại:

* Remote MCP: Gemini 3 chưa hỗ trợ máy chủ Giao thức Ngữ cảnh Mô hình Từ xa (MCP) trong Interactions API, mặc dù Google lưu ý rằng điều này "sẽ sớm ra mắt". * Khoảng trống tính năng: Một số điểm cuối tiện ích chuyên biệt, như Batch API và bộ nhớ đệm do nhà phát triển kiểm soát rõ ràng, vẫn chỉ độc quyền cho API generateContent tiêu chuẩn và sẽ được chuyển sang Interactions API trong các bản cập nhật tương lai.

Google khuyến cáo rằng các nhà phát triển yêu cầu hệ thống sản xuất ổn định, quy mô lớn cho việc tạo văn bản cơ bản vẫn có thể tiếp tục sử dụng generateContent một cách an toàn, vì không có kế hoạch gỡ bỏ điểm cuối này ngay lập tức. Tuy nhiên, những người đang xây dựng thế hệ trợ lý AI và tác tử lập trình tự động tiếp theo được khuyến khích mạnh mẽ áp dụng Interactions API ngay từ hôm nay.