AI tools-ai 16 thg 6, 2026 16 phút đọc

Sakana AI Ra Mắt Marlin: 'CSO Ảo' Nghiên Cứu 'Siêu Sâu' 🤯 Tạo Báo Cáo 100+ Trang Chỉ Trong 8 Giờ, Đặt Lại Chuẩn Mực Về Độ Sâu Của AI!

Startup AI Sakana AI có trụ sở tại Tokyo vừa ra mắt Marlin, một tác nhân nghiên cứu B2B tự động tập trung vào suy luận chuyên sâu kéo dài đến 8 giờ, tạo ra các báo cáo chiến lược 100 trang, nhằm phục vụ các doanh nghiệp lớn thay vì chỉ tạo văn bản tức thời như các chatbot thông thường.

Tier 2 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc venturebeat.com

Giới Thiệu: Marlin – 'CSO Ảo' Định Hình Lại Nghiên Cứu Doanh Nghiệp 🌐

Khởi nghiệp AI Sakana AI từ Tokyo vừa chính thức trình làng sản phẩm thương mại đầu tiên của mình, Sakana Marlin. Được mệnh danh là "CSO Ảo" (Chief Strategy Officer) – Giám đốc Chiến lược Ảo, Marlin là một tác nhân nghiên cứu B2B tự động, chủ động từ bỏ khả năng tạo văn bản tức thời của các chatbot hiện đại để tập trung vào khả năng suy luận chuyên sâu, kéo dài.

Điểm khác biệt lớn nhất của Marlin so với hệ sinh thái công cụ AI hiện tại nằm ở quy mô thời gian: thay vì đưa ra câu trả lời trong vài giây, nó vận hành các vòng lặp suy luận liên tục, tự quản lý trong tối đa tám giờ để cung cấp các báo cáo chiến lược được nghiên cứu kỹ lưỡng, trích dẫn đầy đủ, dài hơn 100 trang và các slide điều hành. Sakana AI cũng đã công bố các báo cáo mẫu do Marlin tạo ra trên trang web sản phẩm của mình.

Trong khi chu kỳ cường điệu về AI tạo sinh phần lớn được định nghĩa bởi tốc độ, Sakana AI khẳng định biên giới doanh nghiệp đang nhanh chóng chuyển từ việc tạo ra thông tin hời hợt, nhanh chóng sang suy luận sâu sắc, có phương pháp. Với Marlin, các doanh nghiệp lớn không còn hỏi AI có thể trả lời nhanh đến mức nào, mà là nó có thể suy nghĩ sâu sắc đến đâu.

Marlin Hoạt Động Như Thế Nào? Từ Chủ Đề Đến Chiến Lược Toàn Diện 💼

Quy trình làm việc của Marlin về cơ bản khác với các tương tác mô hình ngôn ngữ lớn (LLM) thông thường. Thay vì phải trải qua một phiên "prompt engineering" tẻ nhạt, người dùng chỉ cần cung cấp một chủ đề nghiên cứu cốt lõi. Sau một cuộc trao đổi ngắn ban đầu để làm rõ phạm vi và hướng điều tra, con người sẽ hoàn toàn rút lui khỏi quá trình này.

Trong vài giờ tiếp theo, Marlin sẽ hoạt động như một đội ngũ chiến lược số độc lập. Nó tự xây dựng các giả thuyết ban đầu, điều hướng web để thu thập dữ liệu, kiểm tra chéo các nguồn để xác minh kết quả và lập bản đồ động lực nhân quả trong các môi trường kinh doanh phức tạp. Nó thực sự đang tìm kiếm "công thức chiến thắng" trong một biển thông tin nhiễu loạn.

Hãy hình dung Marlin ít giống một công cụ tìm kiếm mà giống một chuyên gia tư vấn chiến lược cấp dưới bị khóa trong một căn phòng với bảng trắng và kết nối internet. Bạn cung cấp yêu cầu chiến lược vào buổi sáng và đến cuối ngày làm việc, hệ thống sẽ cung cấp một bộ hồ sơ toàn diện, chuyên nghiệp. Sản phẩm cuối cùng không phải là một khối văn bản chung chung mà là một bộ tùy chọn chiến lược có cấu trúc, kèm theo các slide tóm tắt điều hành, phụ lục, tài liệu tham khảo và báo cáo chuyên sâu.

Công ty đã nêu bật một số trường hợp sử dụng thực tế để chứng minh khả năng tổng hợp phức tạp của Marlin, bao gồm:

* Tạo kịch bản giải quyết chi tiết cho một cuộc phong tỏa giả định ở Eo biển Hormuz. * Lập bản đồ các quy định AI toàn cầu rời rạc. * Phân tích các xu hướng kinh tế vĩ mô như sự trở lại của "bond vigilantes".

Đằng Sau Sức Mạnh: Động Cơ Suy Luận 'Dài Hạn' AB-MCTS 🧠

Đằng sau lớp vỏ, Marlin là đỉnh cao thương mại của những đột phá nghiên cứu sâu rộng từ phòng thí nghiệm Sakana AI trong hai năm qua. Sản phẩm được cung cấp bởi một công cụ khám phá dựa trên thành tựu nghiên cứu trước đó của Sakana: Adaptive Branching Monte Carlo Tree Search (AB-MCTS) và tận dụng các khung công tác từ "The AI Scientist" – một dự án nghiên cứu trước đây của Sakana AI đã được giới thiệu trên tạp chí Nature, tự động hóa thành công quy trình khám phá khoa học từ ý tưởng đến đánh giá ngang hàng.

Để hiểu cách hoạt động trong thực tế, hãy xem xét một phép tương tự trong thế giới thực: các công cụ cờ vua hiện đại. Khi một máy tính chơi cờ, nó không chỉ nhìn vào bàn cờ và đoán; nó chơi hàng ngàn nước đi tiềm năng trong tương lai, đánh giá sức mạnh của mỗi vị trí tạo ra trước khi thực hiện một hành động. Động cơ AB-MCTS của Marlin cũng làm điều tương tự cho nghiên cứu.

Bên Trong Động Cơ: Cơ Chế Của AB-MCTS

Nếu truyền thống, các nhà phát triển cố gắng trích xuất suy luận chất lượng cao hơn từ các mô hình ngôn ngữ lớn bằng phương pháp "lấy mẫu lặp lại" (repeated sampling) – tức là chạy mô hình hàng chục lần song song và hy vọng một trong các câu trả lời là chính xác. Tuy nhiên, lấy mẫu lặp lại hoạt động một cách mù quáng; nó không thể tự đánh giá các bước trung gian hoặc xoay chuyển dựa trên phản hồi bên ngoài.

AB-MCTS thay thế mô hình này bằng một phương pháp đa lượt có nguyên tắc, được điều khiển bởi một khung quyết định Bayesian. Khi AI xây dựng một báo cáo chiến lược, hệ thống coi quá trình nghiên cứu như một cây phân nhánh của các khả năng. Tại mỗi nút của cây, thuật toán động cân bằng hai hành vi riêng biệt dựa trên tín hiệu phản hồi bên ngoài:

* Mở rộng (Exploration): Tạo ra các giả thuyết hoặc phản hồi ứng viên hoàn toàn mới, thay thế khi con đường hiện tại mang lại lợi nhuận giảm dần hoặc mâu thuẫn chưa được giải quyết. * Đào sâu (Exploitation): Tinh chỉnh, kiểm toán và xây dựng có phương pháp trên một giải pháp ứng viên hiện có cho thấy tiềm năng chiến lược cao.

Điều biến đổi đây từ một thí nghiệm trong phòng thí nghiệm thành một động cơ thương mại là sự mở rộng thành Multi-LLM AB-MCTS. Kiến trúc của Sakana AI giới thiệu một chiều thứ ba quan trọng cho cây tìm kiếm: khả năng chọn động mô hình nào để gọi cho một nhiệm vụ phụ cụ thể, coi các mô hình tiên tiến hàng đầu trong ngành như một mạng lưới trí tuệ tập thể "plug-and-play".

Theo tài liệu kỹ thuật của công ty, động cơ có thể điều phối các mô hình rất không đồng nhất – cho phép một mô hình điều phối ủy quyền ý tưởng ban đầu cho một LLM, đồng thời sử dụng một mô hình nặng về suy luận để kiểm toán, xác minh và sửa lỗi trung gian được tạo ra sớm hơn trong cây tìm kiếm. Bằng cách mở rộng tính toán tại thời điểm suy luận – tận dụng các "tính cách" và điểm mạnh khác nhau của nhiều mô hình nền tảng qua hàng ngàn chu kỳ tự động – AB-MCTS cung cấp các hàng rào toán học mà Marlin yêu cầu. Nó đảm bảo rằng các báo cáo chiến lược dài 100 trang không chỉ là những thế hệ AI dài dòng, mà là sản phẩm được kiểm duyệt kỹ lưỡng của quá trình thử và sai có hệ thống, tự động.

Chính Sách Doanh Nghiệp: Bảo Mật Dữ Liệu & Giá Thành Hấp Dẫn 🔒

Điều quan trọng cần lưu ý là Sakana Marlin không phải là một công cụ dành cho người tiêu dùng nói chung; đây là một dịch vụ phần mềm thương mại (SaaS) giới hạn cho các tổ chức, doanh nghiệp và chủ sở hữu duy nhất.

Đối với doanh nghiệp, các điều khoản cấp phép và xử lý dữ liệu thường là yếu tố quyết định việc áp dụng phần mềm. Không giống nhiều công cụ AI cấp độ người tiêu dùng thường âm thầm thu thập thông tin đầu vào và dữ liệu độc quyền để đào tạo các mô hình nền tảng trong tương lai, Sakana Marlin hoạt động dưới một chính sách dữ liệu nghiêm ngặt, cấp độ doanh nghiệp. Cả Sakana AI lẫn các nhà cung cấp dịch vụ AI bên ngoài đều sẽ không sử dụng dữ liệu khách hàng hoặc thông tin đầu vào để đào tạo hoặc tinh chỉnh mô hình trừ khi khách hàng cung cấp sự đồng ý rõ ràng.

Ngay cả khi có sự đồng ý, dữ liệu cũng được xử lý kỹ lưỡng để loại bỏ thông tin nhận dạng cá nhân. Bảo mật khép kín này là hoàn toàn cần thiết cho các công ty xử lý nghiên cứu M&A nhạy cảm, chiến lược sản phẩm chưa công bố hoặc phân tích thị trường độc quyền.

Cấp phép thương mại được cấu trúc thành các mô hình giá theo bậc, phản ánh bản chất doanh nghiệp của nó:

* Pay-as-you-go: Người dùng có thể mua tín dụng theo yêu cầu, với một lần chạy tốn 100 tín dụng và các tín dụng bổ sung có giá 98 yên (khoảng 0.61 USD) mỗi tín dụng. * Pro Plan: Với 150.000 yên (khoảng 935.68 USD) mỗi tháng, doanh nghiệp nhận được 2.000 tín dụng, giảm chi phí tín dụng bổ sung xuống 90 yên (khoảng 0.56 USD). * Team Plan: Hướng đến các phòng ban lớn hơn, gói 400.000 yên (khoảng 2.495.14 USD) mỗi tháng này bao gồm 6.000 tín dụng, giảm chi phí bổ sung xuống 85 yên (khoảng 0.53 USD) mỗi tín dụng. * Enterprise: Báo giá tùy chỉnh hoàn toàn với hỗ trợ chuyên dụng và phân bổ tín dụng tùy chỉnh.

Vì Sao Sakana AI Đáng Được Quan Tâm? Từ Tầm Nhìn Đến Thực Tiễn 🌟

Sự chuyển đổi của Sakana AI thành một cường quốc doanh nghiệp thương mại bắt nguồn từ tầm cỡ của những người sáng lập, những người đã nổi tiếng góp phần châm ngòi cho sự bùng nổ AI tạo sinh hiện tại. Thành lập tại Tokyo vào năm 2023, khởi nghiệp này được đồng sáng lập bởi Llion Jones – đồng tác giả của bài báo "Attention Is All You Need" năm 2017 của Google, người đã đặt ra thuật ngữ "transformer" – và David Ha, cựu nhà nghiên cứu Google Brain và trưởng bộ phận nghiên cứu tại Stability AI.

Quyết định xây dựng một phòng thí nghiệm mới bên ngoài "bong bóng Silicon Valley" là một sự bác bỏ có chủ ý đối với hệ sinh thái AI hiện tại. Tại một hội nghị TED AI vào cuối năm 2025, Jones đã thẳng thắn bày tỏ rằng ông "hoàn toàn chán ngấy" các transformer, cảnh báo rằng áp lực dữ dội từ các nhà đầu tư và sự quá chú trọng vào việc mở rộng các mô hình đơn lẻ, nguyên khối đã làm chai cứng sự sáng tạo của ngành và khiến các nhà nghiên cứu mù quáng trước những đột phá lớn tiếp theo.

Để thoát khỏi "bệnh công ty lớn", Jones và Ha đã cấu trúc Sakana AI dựa trên các nguyên tắc mô phỏng sinh học và điện toán tiến hóa. Tên công ty, có nguồn gốc từ từ "cá" trong tiếng Nhật, phản ánh triết lý kỹ thuật cốt lõi của họ: tận dụng trí tuệ tập thể tương tự như các đàn cá, đàn kiến hoặc bầy côn trùng. Thay vì cố gắng xây dựng một mô hình nền tảng khổng lồ, làm được tất cả, nghiên cứu của Sakana đã liên tục tập trung vào việc triển khai các mạng lưới mô hình nhỏ hơn, chuyên biệt hơn, cộng tác động để thích nghi với các môi trường phức tạp. Triết lý này cho rằng bằng cách coi các mô hình AI riêng lẻ như thành viên của một "đội hình trong mơ" với những thế mạnh bổ sung, các hệ thống có thể đạt được khả năng suy luận mạnh mẽ và hiệu quả hơn về chi phí so với việc chỉ dựa vào quy mô thuần túy.

Cách tiếp cận lấy cảm hứng từ tự nhiên này nhanh chóng mang lại lợi ích trong các thử nghiệm cạnh tranh nghiêm ngặt:

* Vào đầu năm 2026, ALE-Agent của công ty đã giành vị trí đầu tiên trong cuộc thi AtCoder Heuristic Contest (AHC058) cực kỳ phức tạp, một thách thức tối ưu hóa tổ hợp, vượt trội hơn 800 lập trình viên hàng đầu bằng cách tự động xây dựng và kiểm tra hàng trăm giải pháp trong cửa sổ bốn giờ. * Tương tự, Sakana đã giới thiệu "RL Conductor," một mô hình nhỏ 7 tỷ tham số được đào tạo thông qua học tăng cường đặc biệt để điều phối và ủy quyền các nhiệm vụ giữa một nhóm đa dạng các mô hình "worker" – từ GPT-5 đến Claude Sonnet 4 – đạt được kết quả tiên tiến trong các điểm chuẩn suy luận với chi phí tính toán chỉ bằng một phần nhỏ so với truyền thống.

Sự phát triển nhanh chóng của Sakana từ một phòng thí nghiệm nghiên cứu đột phá thành nhà cung cấp phần mềm thương mại đã thu hút sự chú ý mạnh mẽ từ các "ông lớn" tài chính toàn cầu. Vào cuối năm 2025, khởi nghiệp có trụ sở tại Tokyo này đã huy động thành công vòng tài trợ Series B khổng lồ, đẩy định giá sau tiền lên hơn 2.6 tỷ USD, củng cố vị thế là một trong những công ty công nghệ tư nhân được định giá cao nhất Nhật Bản. Công ty tự hào với danh sách rộng lớn các nhà đầu tư chiến lược, bao gồm các nhà đầu tư mạo hiểm sớm như Khosla Ventures, Lux Capital và New Enterprise Associates (NEA), cùng với các "ông trùm" ngành như Nvidia và Google. Khi Sakana mở rộng trọng tâm sang các lĩnh vực quan trọng như quốc phòng và tài chính, nó cũng đã thu hút đầu tư từ các tổ chức ngân hàng lớn toàn cầu như Mitsubishi UFJ Financial Group (MUFG) và Citi, cũng như gã khổng lồ công nghệ doanh nghiệp Salesforce, định vị khởi nghiệp này để tích cực định hình lại cơ sở hạ tầng AI của doanh nghiệp từ gốc rễ.

Phản Ứng Cộng Đồng & Thử Nghiệm Thực Tế 📈

Sự chuyển hướng của Sakana AI sang các tác nhân thương mại, suy luận dài hạn không phải là một sự kiện ngẫu nhiên. Công ty đã chạy một thử nghiệm beta kín nghiêm ngặt bắt đầu từ tháng 4 năm 2026, đưa công cụ này vào tay khoảng 300 chuyên gia tại các tổ chức tài chính, công ty tư vấn và viện nghiên cứu. Phản hồi cho thấy sự khác biệt định tính rõ rệt giữa các chatbot tạo sinh tiêu chuẩn và cách tiếp cận tự động, dựa trên sự thật của Marlin.

Một nhà tư vấn cấp cao tại một công ty tư vấn lớn ở Tokyo lưu ý rằng công cụ này "vượt xa mong đợi bằng cách khám phá những góc độ mà chúng tôi chưa từng tưởng tượng," ca ngợi khả năng của nó trong việc đạt được sự toàn diện như con người nhưng loại bỏ thành kiến của con người. Trong khi đó, một bộ phận an ninh mạng tại một nhà tích hợp hệ thống CNTT lớn của Nhật Bản đã ca ngợi hệ thống vì đã cung cấp "một báo cáo rất thuyết phục được thúc đẩy bởi nghiên cứu sơ cấp, chất lượng cao," thay vì dựa vào các nguồn thứ cấp được tái chế.

Trên mạng xã hội, thông báo của công ty đã gây tiếng vang với sự "thèm khát" ngày càng tăng của cộng đồng công nghệ đối với các tác nhân tự động. Khi ngành AI trưởng thành, đề xuất giá trị rõ ràng đang thay đổi. Các công cụ hoạt động như bách khoa toàn thư đối thoại nhanh chóng đang trở thành hàng hóa. Với Sakana Marlin, trọng tâm chuyển hoàn toàn sang việc tách biệt công việc nặng nhọc của suy nghĩ khỏi hành động quyết định cuối cùng. Bằng cách ủy thác việc lập bản đồ toàn diện các động lực nhân quả cho một tác nhân có khả năng suy luận bền vững, các nhà điều hành con người có thể tự do làm những gì họ giỏi nhất: hành động.