Bỏ qua đến nội dung chính
Về trang chủ
AI 1 phút đọc

JetBrains ra mắt Mellum2: Mô hình Mixture-of-Experts 12B mạnh mẽ cho lập trình

JetBrains giới thiệu Mellum2, thế hệ mô hình AI mới sử dụng kiến trúc Mixture-of-Experts (MoE) với 12 tỷ tham số, tối ưu hóa đặc biệt cho các tác vụ phát triển phần mềm và tích hợp sâu vào IDE.

Tier 1 · nguồn 81% độ tin cậy Đã được duyệt
Nguồn gốc huggingface.co

JetBrains vừa chính thức ra mắt Mellum2, một bước tiến lớn trong nỗ lực tự chủ công nghệ AI của hãng.

Mellum2 là gì?

Mellum2 là mô hình ngôn ngữ lớn (LLM) được xây dựng trên kiến trúc Mixture-of-Experts (MoE) với tổng cộng 12 tỷ tham số. Khác với Mellum đời đầu, Mellum2 được đào tạo từ đầu trên tập dữ liệu khổng lồ bao gồm mã nguồn và tài liệu kỹ thuật chất lượng cao.

Những cải tiến vượt trội

- Hiệu suất lập trình: Mellum2 vượt xa phiên bản tiền nhiệm trong các bài kiểm tra về hoàn thiện mã (code completion) và giải thích mã. - Tốc độ và Hiệu quả: Kiến trúc MoE cho phép mô hình chỉ kích hoạt các "chuyên gia" (experts) cần thiết, giúp giảm độ trễ và chi phí tính toán trong khi vẫn duy trì độ chính xác cao. - Tích hợp sâu: Mô hình được thiết kế để chạy mượt mà bên trong hệ sinh thái IDE của JetBrains thông qua AI Assistant.

Tại sao điều này quan trọng?

Việc JetBrains tự phát triển mô hình riêng thay vì phụ thuộc hoàn toàn vào OpenAI hay Anthropic cho thấy xu hướng các công ty công cụ lập trình đang muốn tối ưu hóa AI cho các ngữ cảnh đặc thù. Mellum2 hứa hẹn mang lại trải nghiệm code thông minh và nhanh nhạy hơn cho hàng triệu lập trình viên.