Bỏ qua đến nội dung chính
Về trang chủ
AI 3 phút đọc

Liquid AI ra mắt LFM2.5-8B-A1B: Mô hình MoE tối ưu mạnh mẽ cho thiết bị cá nhân 🚀

Liquid AI giới thiệu LFM2.5-8B-A1B, mô hình ngôn ngữ 8 tỷ tham số với kiến trúc MoE lai, được thiết kế đặc biệt cho điện thoại, laptop và robot. Với cửa sổ ngữ cảnh 128K, đây là bước tiến lớn giúp đưa AI hiệu năng cao trực tiếp lên các thiết bị đầu cuối.

Tier 1 · nguồn 90% độ tin cậy Đã được duyệt
Nguồn gốc x.com

Liquid AI, công ty khởi nghiệp từ MIT nổi tiếng với việc phát triển các kiến trúc mô hình nền tảng "lỏng" (Liquid Foundation Models - LFMs) phi Transformer, vừa chính thức công bố LFM2.5-8B-A1B. Đây là bước tiến mới nhất của hãng trong nỗ lực dân chủ hóa AI, đưa khả năng xử lý thông minh vượt trội từ các trung tâm dữ liệu khổng lồ về trực tiếp các thiết bị đầu cuối như điện thoại thông minh, máy tính xách tay, máy tính cá nhân và hệ thống robot tự hành.

Diễn biến

Theo thông tin công bố từ Liquid AI, mô hình LFM2.5-8B-A1B được xây dựng trên kiến trúc Mixture of Experts (MoE) lai (hybrid) thế hệ mới. Mặc dù tổng dung lượng tham số đạt mức 8 tỷ (8B), nhưng nhờ cơ chế định tuyến thông minh, mô hình chỉ kích hoạt khoảng 1,5 tỷ tham số (active parameters) cho mỗi tác vụ xử lý cụ thể. Cách tiếp cận này cho phép hệ thống duy trì được độ thông minh và khả năng suy luận của một mô hình lớn, trong khi lại tiêu tốn cực kỳ ít tài nguyên điện năng và bộ nhớ, giúp nó vận hành mượt mà ngay cả trên các bộ vi xử lý di động tầm trung.

Một trong những nâng cấp đáng giá nhất ở phiên bản này là việc mở rộng cửa sổ ngữ cảnh (context window) lên mức 128K token. Đối với các mô hình tối ưu hóa cho thiết bị (Edge AI), đây là một con số vô cùng ấn tượng. Nó cho phép người dùng nạp các tập tài liệu dài hàng trăm trang, phân tích toàn bộ một thư mục mã nguồn phức tạp hoặc duy trì những cuộc hội thoại kéo dài mà không gặp hiện tượng "quên" thông tin hay suy giảm chất lượng câu trả lời. Liquid AI khẳng định kiến trúc LFM2.5 là kết quả của việc kết hợp tinh tế giữa các hệ thống động học (dynamical systems) và các kỹ thuật học máy tiên tiến, giúp tối ưu hóa đồng thời cả tốc độ phản hồi lẫn độ chính xác trong các tác vụ thực tế.

Vì sao đáng chú ý

Sự ra đời của LFM2.5-8B-A1B giải quyết một trong những thách thức lớn nhất của ngành AI hiện nay: bài toán cân bằng giữa hiệu suất và quyền riêng tư. Việc triển khai AI trực tiếp "tại biên" (on-device) giúp dữ liệu người dùng được xử lý cục bộ, không cần gửi lên máy chủ đám mây, từ đó tăng cường bảo mật và giảm thiểu tối đa độ trễ. Điều này đặc biệt có ý nghĩa với các ứng dụng nhạy cảm về thời gian như điều khiển robot trong công nghiệp hoặc các trợ lý ảo cá nhân xử lý thông tin riêng tư.

Đối với cộng đồng công nghệ và các doanh nghiệp tại Việt Nam, sự xuất hiện của các mô hình MoE nhẹ như của Liquid AI mở ra cơ hội lớn để tối ưu hóa chi phí vận hành. Thay vì phải đầu tư vào các hệ thống GPU đắt đỏ hoặc chi trả phí API lớn cho các ông lớn công nghệ, doanh nghiệp có thể triển khai AI trực tiếp trên hạ tầng PC hoặc máy chủ nhẹ sẵn có với hiệu năng tương đương các mô hình Transformer hàng đầu. Tuy nhiên, thách thức đặt ra cho Liquid AI vẫn là việc chứng minh hiệu quả thực tế của kiến trúc phi Transformer trong việc hỗ trợ đa ngôn ngữ, đặc biệt là tiếng Việt, cũng như khả năng tương thích với các công cụ tối ưu hóa phổ biến hiện nay.