Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 6 phút đọc

Sakana AI ra mắt Fugu: Dàn nhạc AI đa tác tử đạt hiệu năng đỉnh cao, né rủi ro kiểm soát xuất khẩu! 🚀🇻🇳

Sakana AI vừa trình làng Fugu, hệ thống điều phối AI đa tác tử đột phá, giúp các doanh nghiệp Việt Nam và toàn cầu đạt hiệu năng tương đương các mô hình tiên tiến nhất mà không lo phụ thuộc nhà cung cấp hay rủi ro kiểm soát xuất khẩu địa chính trị.

Tier 2 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc the-decoder.com

Sakana AI, startup AI có trụ sở tại Tokyo, Nhật Bản, vừa chính thức ra mắt Sakana Fugu – một hệ thống điều phối AI đa tác tử đầy sáng tạo, được cung cấp qua API tương thích OpenAI. Thay vì huấn luyện một mô hình "biên giới" khổng lồ duy nhất, Sakana Fugu linh hoạt phối hợp và định tuyến nhiệm vụ giữa một nhóm các mô hình hiện có (bao gồm Claude, GPT, và Gemini). Điều này giúp nó đạt được kết quả tiên tiến, sánh ngang với các mô hình hàng đầu như Claude Fable 5 và Mythos Preview của Anthropic, mà không bị phụ thuộc vào một nhà cung cấp duy nhất hay đối mặt với rủi ro kiểm soát xuất khẩu địa chính trị. Đây thực sự là một bước tiến chiến lược trong bối cảnh địa chính trị phức tạp hiện nay.

💡 Triết lý: Vượt xa "Mở rộng quy mô" để hướng tới "Phối hợp tiến hóa"

Trong nhiều năm, ngành công nghiệp AI đã tập trung vào việc mở rộng quy mô – xây dựng các mô hình nguyên khối lớn hơn và đòi hỏi nhiều điện toán hơn. Tuy nhiên, Sakana AI lập luận rằng các nhiệm vụ phức tạp, nhiều bước trong thế giới thực hiếm khi được giải quyết tối ưu chỉ bằng một lần gọi mô hình duy nhất.

Triết lý cốt lõi của Sakana là một đội ngũ các mô hình được phối hợp chặt chẽ, ăn ý có thể vượt trội hơn bất kỳ mô hình "ngôi sao" đơn độc nào. Fugu đóng vai trò như một nhạc trưởng tài ba, linh hoạt quyết định: * Mô hình nào nên xử lý từng nhiệm vụ con. * Khi nào nên ủy quyền xử lý hoặc yêu cầu xác minh. * Cách kết hợp các điểm mạnh riêng lẻ của từng mô hình đồng thời khắc phục điểm yếu của chúng.

Cách tiếp cận này không chỉ thanh lịch về mặt kỹ thuật mà còn cực kỳ quan trọng về mặt địa chính trị. Các lệnh kiểm soát xuất khẩu gần đây của Mỹ đã ngay lập tức tước bỏ quyền truy cập toàn cầu vào các mô hình Fable 5 và Mythos 5 của Anthropic. Bằng cách sử dụng Sakana Fugu, các doanh nghiệp có thể duy trì quyền truy cập vào hiệu suất cấp "biên giới" thông qua một hệ sinh thái đa nhà cung cấp kiên cường. Điều này mang lại sự ổn định và an ninh đáng kể cho các hoạt động kinh doanh toàn cầu.

⚙️ Kiến trúc kỹ thuật: "Nhạc trưởng" RL 7B

Ẩn dưới lớp vỏ bọc, Sakana Fugu được cung cấp sức mạnh bởi một mô hình điều phối viên nhẹ nhàng dựa trên Qwen2.5-7B. "Nhạc trưởng" này được huấn luyện đặc biệt cho việc phối hợp tác tử bằng cách sử dụng Tối ưu hóa Chính sách Tương đối Nhóm (GRPO) và học tăng cường (Reinforcement Learning).

Thay vì trực tiếp tạo ra câu trả lời, "Nhạc trưởng" RL sẽ quyết định: 1. Mô hình "biên giới" nào trong nhóm nên trả lời phần nào của lời nhắc người dùng. 2. Thứ tự gọi các mô hình. 3. Hướng dẫn hệ thống cụ thể nào cần cung cấp cho mỗi mô hình. 4. Phần công việc nào của các tác tử trước đó nên hiển thị cho các tác tử tiếp theo.

Sự điều phối tinh vi này dựa trên hai công trình nghiên cứu đột phá được Sakana AI công bố: * TRINITY: An Evolved LLM Coordinator: Sử dụng một điều phối viên tiến hóa để gán các vai trò chuyên biệt như Người suy nghĩ (lập luận), Người thực hiện (thực thi) và Người xác minh (xác thực) nhằm quản lý thích ứng các nhiệm vụ lập trình, toán học và logic qua nhiều lượt. * Learning to Orchestrate Agents in Natural Language with the Conductor: Huấn luyện điều phối viên thông qua học tăng cường để khám phá các chiến lược phối hợp và mẫu giao tiếp bằng ngôn ngữ tự nhiên, vượt trội hơn các mô hình riêng lẻ trên các điểm chuẩn khó.

🏆 Đột phá điểm chuẩn: Fugu Ultra sánh ngang Fable 5!

Các kết quả điểm chuẩn dành cho Fugu Ultra – phiên bản ưu tiên chất lượng cao cấp – đã chứng minh sức mạnh to lớn của kiến trúc này:

* SWE-Bench Pro (Kỹ thuật phần mềm): Fugu Ultra đạt 73.7, vượt qua Claude Opus 4.8 (69.2) và GPT-5.5 (58.6). Thật ấn tượng! * LiveCodeBench (Lập trình): Fugu Ultra đạt 93.2 (và Fugu đạt 92.9), vượt trội hơn Gemini 3.1 Pro (88.5). Một minh chứng cho khả năng giải quyết vấn đề của nó. * Humanity's Last Exam (Kiến thức tổng quát khó): Fugu Ultra đạt 50.0, sánh ngang với điểm số 49.8 của Claude Opus 4.8.

Điều quan trọng cần nhấn mạnh là cả Claude Fable 5 lẫn Claude Mythos Preview đều không có mặt trong nhóm tác tử của Fugu, vì chúng không thể truy cập công khai. Tuy nhiên, Fugu Ultra vẫn thành công sánh vai với chúng trên các bài kiểm tra khắt khe này, hoàn toàn nhờ vào sự điều phối thông minh của các mô hình khác có thể truy cập được.

Trong một minh chứng ấn tượng về khả năng suy luận, Fugu Ultra đã giải một câu đố Rubik trong vỏn vẹn 19 nước đi – cực kỳ gần với giới hạn lý thuyết toán học được gọi là "số của Chúa". Quá đỉnh! 🤯

💰 Giá cả, Biến thể và Khả năng tương thích OpenAI

Sakana Fugu được ra mắt với hai biến thể chính để đáp ứng các yêu cầu vận hành khác nhau: 1. Fugu Mini: Tối ưu hóa cho độ trễ thấp và thời gian phản hồi nhanh. 2. Fugu Ultra: Thiết kế cho các tác vụ lập luận phức tạp, kỹ thuật, nơi chất lượng và độ chính xác là tối quan trọng.

Đối với các nhà phát triển, việc tích hợp vô cùng liền mạch. API của Fugu hoàn toàn tương thích với OpenAI. Nếu bạn đã và đang gọi các API của GPT, Claude hoặc Gemini, bạn chỉ cần thay đổi một điểm cuối duy nhất và để Fugu tự động quản lý tất cả quá trình điều phối đa mô hình một cách minh bạch, không cần viết lại bất kỳ phần nào trong luồng công việc hiện có. Thật tiện lợi! ✨