AI tools-ai 17 thg 6, 2026 3 phút đọc

DivInit: Nâng Tầm Tìm Kiếm Agentic AI Bằng Chiến Lược Khởi Tạo Truy Vấn Đa Dạng! 🚀💡

Một nghiên cứu mới mang tên DivInit đã chứng minh khả năng cải thiện đáng kể hiệu suất của tìm kiếm tác tử (agentic search) bằng cách đa dạng hóa các truy vấn khởi tạo, giải quyết vấn đề trùng lặp thông tin và mang lại kết quả tối ưu hơn mà không cần huấn luyện lại mô hình.

Tier 2 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc arxiv.org

DivInit: Chiến Lược Đột Phá Tối Ưu Hóa Tìm Kiếm Agentic AI 🚀Trong bối cảnh AI đang phát triển mạnh mẽ, tìm kiếm tác tử (agentic search) nổi lên như một phương pháp then chốt giúp các mô hình ngôn ngữ lớn (LLMs) vượt qua giới hạn của một lần gọi API duy nhất, bằng cách thực hiện chuỗi hành động và tương tác đa bước để giải quyết các tác vụ phức tạp. Tuy nhiên, việc mở rộng quy mô cho phương pháp này vẫn còn nhiều thách thức.# Thách Thức Từ Phương Pháp Mở Rộng Quy Mô Truyền Thống 🤔Theo Sylvie, chuyên gia phân tích của Kalera News, các phương pháp mở rộng quy mô hiện tại thường tập trung vào tăng chiều sâu (tức là nhiều lượt tương tác và token hơn mỗi chuỗi hành động) hoặc chiều rộng (tức là nhiều lần chạy song song hơn).Tuy nhiên, nghiên cứu mới trên [arXiv:2606.17209](https://arxiv.org/abs/2606.17209) chỉ ra rằng việc mở rộng theo chiều rộng bằng cách lấy mẫu song song tiêu chuẩn đang gặp phải vấn đề lợi nhuận giảm dần. Nguyên nhân chính là do sự trùng lặp truy vấn ngay ở lượt đầu tiên.Khi các mô hình đưa ra những truy vấn khởi đầu quá giống nhau trên các lần chạy song song, các luồng thông tin sẽ truy xuất bằng chứng chồng chéo. Điều này khiến các lượt sau đó đều bị điều kiện hóa bởi cùng một tập hợp thông tin đã được truy xuất chung, hạn chế khả năng khám phá đa dạng của tác tử.# DivInit: Giải Pháp Thông Minh Không Cần Huấn Luyện 💡Để giải quyết hạn chế này, các nhà nghiên cứu đã giới thiệu DivInit – một phương pháp can thiệp ngay ở lượt đầu tiên mà không cần huấn luyện lại mô hình.Thay vì lấy mẫu `k` truy vấn khởi tạo độc lập, DivInit sẽ thực hiện một lần gọi duy nhất để tạo ra `n` truy vấn ứng cử viên. Từ `n` ứng viên này, nó sẽ chọn ra `k` truy vấn khác biệt (diverse seeds) nhất và sử dụng chúng để khởi chạy các chuỗi hành động song song.# Hiệu Quả Vượt Trội Và Tiềm Năng Lớn 💪Kết quả từ năm mô hình mã nguồn mở và tám bộ tiêu chuẩn khác nhau đã chứng minh rằng DivInit liên tục vượt trội so với phương pháp lấy mẫu song song tiêu chuẩn. Cụ thể, DivInit đạt được mức tăng trung bình từ 5 đến 7 điểm trong các tác vụ hỏi đáp đa bước (multi-hop QA) với cùng một mức tiêu thụ tài nguyên tính toán.Đây là một bước tiến đáng kể, mở ra hướng đi mới cho việc tối ưu hóa hiệu suất của các hệ thống tìm kiếm tác tử. Mã nguồn của DivInit đã được công bố rộng rãi trên GitHub: [https://github.com/cxcscmu/diverse-query-initialization](https://github.com/cxcscmu/diverse-query-initialization). Bạn đọc có thể tìm hiểu thêm chi tiết trong bài viết gốc tại arXiv: [https://arxiv.org/abs/2606.17209](https://arxiv.org/abs/2606.17209).# Lời Kết Từ Kalera News 🌟Tại Kalera News, chúng tôi luôn đánh giá cao những giải pháp thực tế và hiệu quả như DivInit. Việc tối ưu hóa chiến lược khởi tạo truy vấn không chỉ giúp các mô hình AI hoạt động thông minh hơn mà còn tiết kiệm tài nguyên, mở ra nhiều ứng dụng tiềm năng trong các hệ thống AI phức tạp. Đây chắc chắn là một công nghệ đáng để cộng đồng AI và công nghệ theo dõi sát sao.