AI tools-ai 26 thg 6, 2026 10 phút đọc

Liquid AI Ra Mắt LFM2.5-230M: Mô Hình AI Nhỏ Nhất "Chạy Mọi Nơi", Đánh Bại Đối Thủ Gấp 4 Lần Kích Thước Trong Trích Xuất Dữ Liệu! 🤖✨

Mô hình LFM2.5-230M siêu nhỏ của Liquid AI, với chỉ 230 triệu tham số, đã chứng minh khả năng vượt trội trong việc trích xuất dữ liệu và triển khai trên thiết bị cục bộ, thậm chí đánh bại các mô hình lớn gấp 4 lần, mở ra kỷ nguyên mới cho AI trên thiết bị biên và các quy trình tự động hóa hiệu quả.

Tier 2 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc venturebeat.com

Liquid AI, công ty được thành lập bởi các nhà khoa học máy tính từng làm việc tại MIT, vừa ra mắt mô hình ngôn ngữ AI nhỏ nhất của mình, LFM2.5-230M. Mô hình này hứa hẹn sẽ thay đổi cách các doanh nghiệp tiếp cận việc trích xuất dữ liệu và triển khai AI cục bộ trên điện thoại thông minh, máy tính xách tay và robot.

Với chỉ 230 triệu tham số, LFM2.5-230M là một mô hình nền tảng được thiết kế đặc biệt cho các quy trình tác tử (agentic workflows) trên thiết bị, cho phép nó chạy gần như "mọi nơi" theo tuyên bố của Liquid AI. Điều đáng chú ý hơn, mô hình này còn vượt trội hơn các đối thủ có kích thước gấp hơn 4 lần trong các bài kiểm tra chọn lọc, đặc biệt là ở khả năng trích xuất dữ liệu, đánh bại cả Alibaba Qwen3.5-0.8B (Instruct) 800 triệu tham số và Google Gemma 3 1B 1 tỷ tham số. Thông tin chi tiết được đăng tải trên VentureBeat (Nguồn: https://venturebeat.com/technology/liquid-ais-smallest-model-yet-lfm2-5-230m-beats-models-4x-its-size-at-data-extraction-can-run-anywhere).

Mục tiêu của LFM2.5-230M là các nhà phát triển và kỹ sư đang xây dựng các hệ thống trích xuất dữ liệu nhẹ và các hệ thống biên tự động.

Kiến trúc Đột Phá: Hiệu Quả Hơn Thay Vì "Phô Trương Sức Mạnh" 📈

Trong khi các ông lớn như Anthropic, OpenAI, Google, Microsoft và Meta đang đẩy số lượng tham số lên hàng trăm tỷ hay thậm chí hàng nghìn tỷ để đạt hiệu suất cao nhất, thì một cuộc đua song song đang tập trung hoàn toàn vào các triển khai AI tại biên và cục bộ. LFM2.5-230M của Liquid AI đánh dấu một sự chuyển dịch quan trọng sang hiệu quả kiến trúc thay vì chỉ đơn thuần tăng quy mô.

Bằng cách nén 19 nghìn tỷ token tiền huấn luyện vào một footprint chỉ 230 triệu tham số, Liquid AI chứng minh rằng các thiết bị biên không cần sức mạnh tính toán khổng lồ hay kết nối đám mây liên tục để thực hiện các quy trình tác tử phức tạp, đa bước.

Mô hình này khác biệt so với các mô hình AI nhỏ khác bằng cách sử dụng kiến trúc LFM2 để đạt được tốc độ suy luận cao mà không cần đến lượng bộ nhớ khổng lồ thường thấy ở các transformer nặng tham số.

LFM2.5-230M Hoạt Động Như Thế Nào? 🛠️

LFM2.5-230M không dựa vào kiến trúc transformer tiêu chuẩn mà thay vào đó sử dụng khung LFM2. Kiến trúc này hoạt động như một hệ thống lai, xen kẽ các phép tích chập tầm ngắn được gán cổng (gated short-range convolutions) với cơ chế chú ý truy vấn nhóm (grouped-query attention) để xử lý thông tin hiệu quả.

Đối với những ai đang theo dõi sự phát triển của các kiến trúc hiệu quả, phương pháp của Liquid AI chia sẻ một mục tiêu khái niệm tương tự: quản lý ngữ cảnh dài và dữ liệu tuần tự một cách hiệu quả trên phần cứng biên mà không tốn chi phí bộ nhớ theo cấp số mũ của các cơ chế chú ý thuần túy. Mô hình hỗ trợ cửa sổ ngữ cảnh rộng tới 32K, cho phép nó tiếp nhận các tài liệu lớn hoặc luồng dữ liệu liên tục từ robot.

Hiệu suất vượt trội của mô hình được thể hiện rõ ràng: * Dung lượng bộ nhớ: Dưới 400MB. * Tốc độ suy luận: Vượt trội so với các mô hình tương đương như Gemma 3 1B IT và Granite 4.0-H-350M. * Trên Samsung Galaxy S25 Ultra (CPU Qualcomm Snapdragon Gen4): Đạt tốc độ giải mã 213 tokens mỗi giây. * Trên Raspberry Pi 5: Duy trì tốc độ giải mã 42 tokens mỗi giây. * GPU: Độ trễ từ đầu đến cuối thấp hơn so với các mô hình nhỏ cạnh tranh ở mọi cấp độ đồng thời.

Tại Sao LFM2.5-230M Lại Quan Trọng Đối Với Doanh Nghiệp? 💼💰

Các tổ chức truyền thống đã dựa vào các tập lệnh Trích xuất, Biến đổi, Tải (ETL) cứng nhắc, dựa trên quy tắc để di chuyển và xử lý dữ liệu. Tuy nhiên, các hệ thống cũ này rất dễ hỏng; một thay đổi nhỏ trong bố cục tài liệu hoặc cập nhật schema có thể phá vỡ toàn bộ quy trình.

Để giải quyết vấn đề này, ngành công nghiệp đang chuyển dịch sang "AI ETL", nơi máy học suy luận các ánh xạ, phát hiện sự thay đổi schema và tự động thích ứng với các thay đổi. Trong một quy trình trích xuất dữ liệu nhẹ hiện đại, một mô hình AI kết nối với các nguồn không có cấu trúc — như PDF, email hoặc biểu mẫu web — và cấu trúc hóa dữ liệu thành các định dạng như JSON mà không yêu cầu các quy tắc được mã hóa cứng.

Việc sử dụng một mô hình "khủng" như Claude Opus 4.6 (với chi phí 5,00 USD cho mỗi triệu token đầu vào) để phân tích các hóa đơn thông thường, định dạng địa chỉ hoặc định tuyến dữ liệu đo từ xa là không khả thi về mặt kinh tế. Đây chính là lúc các mô hình như LFM2.5-230M trở nên tối quan trọng. Được thiết kế rõ ràng làm công cụ trích xuất dữ liệu nhẹ, nó cho phép các công ty tự động hóa các tác vụ định dạng và phân tích dữ liệu lặp đi lặp lại với chi phí tính toán và độ trễ thấp hơn nhiều, chạy trực tiếp trên phần cứng cục bộ thay vì phụ thuộc vào các cuộc gọi API đám mây liên tục và đắt đỏ.

LFM2.5-230M vs. Các Mô Hình "Nhỏ" Khác: Ai Là Vua Trích Xuất Dữ Liệu? 👑📊

Ngành công nghiệp AI đang chứng kiến sự hồi sinh của các mô hình "nhỏ", nhưng định nghĩa về "nhỏ" lại rất đa dạng. Ví dụ, VibeThinker-3B của Weibo (3 tỷ tham số) gây ấn tượng với khả năng giải toán, còn Gemma 4 E2B của Google (2 tỷ tham số) được thiết kế cho di động và IoT.

Tuy nhiên, LFM2.5-230M của Liquid AI hoạt động ở một hạng cân hoàn toàn khác. Với chỉ 230 triệu tham số, nó chỉ bằng khoảng một phần mười kích thước của mô hình Gemma 4 nhỏ nhất của Google và VibeThinker-3B. Liquid AI thừa nhận rằng với footprint nhỏ bé này, LFM2.5-230M không được thiết kế để cạnh tranh trong các tác vụ yêu cầu khả năng suy luận cao như toán học nâng cao, lập trình hay viết sáng tạo.

Tuy nhiên, trong các lĩnh vực mục tiêu của nó là trích xuất dữ liệu và gọi công cụ (tool calling), mô hình này lại thể hiện sức mạnh vượt trội: * Điểm chuẩn BFCLv3 (sử dụng công cụ): * LFM2.5-230M: 43.26 * IBM Granite 4.0-350M: 39.58 * Google Gemma 3 1B IT: 16.61 * Điểm chuẩn CaseReportBench (trích xuất dữ liệu): * LFM2.5-230M: 22.51 * Qwen3.5-0.8B (Instruct): (bị bỏ xa)

Điều này chứng tỏ rằng, trong khi các mô hình 3 tỷ tham số như VibeThinker đang giải quyết các phép tính vi phân nâng cao, thì một mô hình 230 triệu tham số như LFM2.5-230M lại là lựa chọn tối ưu và vượt trội cho việc thực hiện các lệnh gọi công cụ có cấu trúc và duy trì hiệu quả các quy trình tác tử trên phần cứng bị hạn chế.

Ứng Dụng Trong Nghiên Cứu Nâng Cao: Khi AI "Chỉ Đạo" Robot 🤖🚶

Với khả năng gọi công cụ xuất sắc, LFM2.5-230M hoạt động chủ yếu như một lớp chọn kỹ năng. Liquid AI đã trình diễn khả năng này bằng cách triển khai mô hình trên một robot hình người Unitree G1. Chạy hoàn toàn trên thiết bị thông qua mô-đun tính toán NVIDIA Jetson Orin của robot, mô hình đã xử lý thành công các lệnh môi trường phức tạp.

Ví dụ, mô hình có thể nhận một chỉ dẫn tự do như: "Hãy đứng yên trong 2 giây, sau đó đi về phía trước với tốc độ 1 mét mỗi giây trong 3 mét, giữ tư thế quỳ một chân về phía trước trong 5 giây, và đi lùi với tốc độ 0,5 mét mỗi giây trong 3 mét", và tự động dịch nó thành một kế hoạch đa bước có cấu trúc, gọi các kỹ năng cấp thấp đã được huấn luyện trước được cung cấp bởi khung NVIDIA SONIC.

Giấy Phép LFM Open License v1.0: "Mở" Nhưng Có Điều Kiện 📜

LFM2.5-230M được phát hành theo Giấy phép Mở LFM v1.0. Mặc dù có từ "Mở" trong tiêu đề, đây không phải là giấy phép tuân thủ Sáng kiến Mã nguồn Mở (OSI); nó hoạt động như một khuôn khổ thương mại hạn chế, có mục đích kép.

* Dành cho nhà phát triển độc lập, nhà nghiên cứu và các startup giai đoạn đầu: Giấy phép hoạt động tương tự như phần mềm mã nguồn mở. Người dùng nhận được giấy phép vĩnh viễn, toàn cầu, miễn phí bản quyền để sao chép, sửa đổi và phân phối mô hình, với điều kiện giữ nguyên thông báo bản quyền gốc và nêu rõ bất kỳ sửa đổi nào. * "Hạn chế Sử dụng Thương mại" nghiêm ngặt: Bất kỳ pháp nhân nào tạo ra doanh thu hàng năm từ 10 triệu USD trở lên sẽ mất quyền sử dụng mô hình cho mục đích thương mại theo thỏa thuận này. Các doanh nghiệp lớn vượt ngưỡng tài chính này phải đàm phán một thỏa thuận thương mại riêng, có trả phí với Liquid AI để triển khai mô hình vào sản xuất. Chiến lược này giúp công ty bảo vệ tài sản trí tuệ của mình khỏi việc bị các tập đoàn công nghệ lớn sử dụng miễn phí, đồng thời vẫn gieo mầm mô hình ở cấp độ nhà phát triển cơ sở.

Mô hình cơ sở và các mô hình đã được huấn luyện hậu kỳ hiện có sẵn trên Hugging Face, với hỗ trợ ngay từ ngày đầu trên hệ sinh thái suy luận cho llama.cpp (GGUF), MLX, vLLM, SGLang và ONNX.