AI tools-ai 9 thg 6, 2026 2 phút đọc

AutoTTS: Giải pháp tự động hóa chiến lược suy luận, giảm 69,5% chi phí token cho LLM

Khung làm việc AutoTTS mới cho phép các mô hình ngôn ngữ lớn tự động tìm kiếm chiến lược suy luận tối ưu, giúp cắt giảm tới 69,5% lượng token tiêu thụ trong khi vẫn nâng cao hiệu quả giải quyết vấn đề.

Tier 2 · nguồn 99% độ tin cậy Đã được duyệt

Meta Google Autotts Optimization Open Source

Nguồn gốc venturebeat.com

Tự động hóa thay vì thiết kế thủ công

Trong kỷ nguyên của các mô hình ngôn ngữ lớn (LLM), kỹ thuật "Test-time scaling" (TTS) – hay việc phân bổ thêm tài nguyên tính toán trong lúc suy luận – đã chứng minh được hiệu quả vượt trội. Tuy nhiên, phần lớn các chiến lược TTS hiện nay vẫn được các nhà nghiên cứu thiết kế thủ công, dựa nhiều vào trực giác và kinh nghiệm cá nhân.

Mới đây, một nhóm nghiên cứu đã giới thiệu AutoTTS, một khung làm việc dựa trên môi trường (environment-driven) giúp thay đổi hoàn toàn cuộc chơi. Thay vì thiết kế từng quy tắc suy luận riêng lẻ, AutoTTS cho phép tự động khám phá các chiến lược tối ưu nhất cho từng nhiệm vụ cụ thể.

Hiệu quả vượt mong đợi với chi phí cực thấp

AutoTTS hoạt động bằng cách chuyển đổi bài toán thiết kế chiến lược thành quá trình tổng hợp bộ điều khiển (controller synthesis). Các bộ điều khiển này sẽ tự quyết định khi nào cần mở rộng nhánh suy luận (branch), tiếp tục, kiểm tra (probe) hoặc dừng lại dựa trên các tín hiệu phản hồi từ mô hình.

Kết quả thực nghiệm trên các bộ dữ liệu về suy luận toán học cho thấy một con số ấn tượng: AutoTTS có thể giúp giảm tới 69,5% lượng token tiêu thụ so với các phương pháp thiết kế thủ công mạnh nhất hiện nay, trong khi vẫn duy trì hoặc cải thiện độ chính xác.

Điểm đặc biệt nhất là chi phí để "khám phá" ra các chiến lược này cực kỳ rẻ. Theo nhóm nghiên cứu, toàn bộ quá trình tìm kiếm chỉ tiêu tốn khoảng 39,9 USD và mất 160 phút để hoàn thành.

Tương lai của suy luận AI hiệu quả

Sự ra đời của AutoTTS không chỉ giúp tiết kiệm chi phí vận hành cho các doanh nghiệp đang triển khai AI mà còn mở ra hướng đi mới trong việc tối ưu hóa khả năng suy luận của máy tính. Các chiến lược được AutoTTS tìm ra còn có khả năng mở rộng (generalize) tốt sang các mô hình và quy mô khác nhau.

Toàn bộ dữ liệu và mã nguồn của dự án hiện đã được nhóm nghiên cứu công bố công khai trên GitHub, hứa hẹn sẽ thúc đẩy cộng đồng AI tiếp tục cải tiến hiệu suất của các hệ thống tự động hóa.