Tuần tới quyết định ngôi vương AI: Google đối đầu OpenAI
Giới công nghệ đang đổ dồn sự chú ý vào tuần tới khi Google và OpenAI được kỳ vọng sẽ tung ra những bản cập nhật lớn như GPT-5.6 hoặc Gemini 3.2 để phân định ngôi vị dẫn đầu.
Tag
Tổng hợp 40 bài Kalera News liên quan đến Model Release — viết tiếng Việt, có dẫn nguồn gốc.
Giới công nghệ đang đổ dồn sự chú ý vào tuần tới khi Google và OpenAI được kỳ vọng sẽ tung ra những bản cập nhật lớn như GPT-5.6 hoặc Gemini 3.2 để phân định ngôi vị dẫn đầu.
Startup Trung Quốc DeepSeek tuyên bố giảm giá vĩnh viễn 75% cho model V4 Pro, trực tiếp thách thức các labs lớn tại Silicon Valley bằng kiến trúc tối ưu chi phí.
CEO Abacus AI tiết lộ tuần này có thể là bước ngoặt lớn với sự ra mắt của mô hình Gemini 3.2 từ Google và khả năng phản pháo từ OpenAI với GPT 5.6.
Gemini Omni là mô hình AI đa phương thức mới nhất của Google, có khả năng hiểu và tạo ra nội dung video, hình ảnh và âm thanh vượt trội.
Google thông báo Gemini 3.5 Flash đã chuyển sang giai đoạn Generally Available (GA), loại bỏ các giới hạn phiên bản preview, đánh dấu bước tiến quan trọng trong khả năng phục vụ thương mại.
Anthropic tung ra bản nâng cấp Claude Opus 4.8 với chế độ 'Fast Mode' rẻ hơn 3 lần và khả năng suy luận vượt trội, tiệm cận dòng model bảo mật Mythos.
Google vừa chứng minh sức mạnh của mô hình Gemini Flash 3.5 khi đạt hiệu năng tương đương với Sonnet 4.6 trên các bảng xếp hạng uy tín, đánh dấu sự trở lại của gã khổng lồ tìm kiếm.
OpenAI vừa chính thức ra mắt mô hình Instant, tập trung vào tốc độ phản hồi cực nhanh cho các tác vụ hội thoại và xử lý văn bản đơn giản.
Microsoft phát hành mô hình Lens trên Hugging Face, một model sinh ảnh từ văn bản với 3,8 tỷ tham số, hỗ trợ độ phân giải lên đến 1440x1440.
Một mô hình ngôn ngữ 9 tỷ tham số mới được huấn luyện chuyên biệt cho các tác vụ gọi công cụ (tool calling) và workflow lập trình tự động đã chính thức ra mắt, hoạt động hiệu quả trên phần cứng giá rẻ.
Hugging Face công bố Ettin Reranker, gia đình 6 mô hình CrossEncoder dựa trên ModernBERT giúp cải thiện độ chính xác cho hệ thống tìm kiếm (RAG) với tốc độ nhanh hơn tới 8 lần.
Người dùng hiện đã có thể dùng thử Gemini Omni Flash, mô hình đầu tiên trong dòng Omni đa phương thức, trên các nền tảng của Google.
DeepMind giới thiệu AlphaEvolve, một coding agent sử dụng sức mạnh của Gemini để tối ưu hóa hiệu suất lập trình trong nghiên cứu khoa học và hạ tầng doanh nghiệp.
Đội ngũ phát triển Paris 2.0 bắt đầu chia sẻ chọn lọc trọng số mô hình (weights) và tìm kiếm đối tác phát triển các hệ thống video, world model và robot. Mô hình hiện đã có mặt trên Hugging Face.
Mark Zuckerberg chính thức công bố Llama 3.1 405B, mô hình mã nguồn mở đầu tiên đạt trình độ 'frontier', cạnh tranh trực tiếp với GPT-4o của OpenAI.
Anthropic vừa công bố Claude Opus 4.8 với khả năng phán đoán sắc bén hơn và thời gian hoạt động độc lập kéo dài. Tuy nhiên, giới chuyên gia vẫn chia rẽ về thực lực thực tế của mô hình này so với GPT 5.5.
Anthropic vừa công bố Claude Opus 4.8, phiên bản nâng cấp mạnh mẽ giúp hãng giành lại ngôi vương hiệu năng từ tay OpenAI và Google, đồng thời giới thiệu tính năng dynamic workflows đột phá.
Liquid AI giới thiệu LFM2.5-8B-A1B, mô hình ngôn ngữ 8 tỷ tham số với kiến trúc MoE lai, được thiết kế đặc biệt cho điện thoại, laptop và robot. Với cửa sổ ngữ cảnh 128K, đây là bước tiến lớn giúp đưa AI hiệu năng cao trực tiếp lên các thiết bị đầu cuối.
Google chính thức cung cấp bộ đôi mô hình sinh hình ảnh Nano Banana 2 và Nano Banana Pro cho lập trình viên và doanh nghiệp qua Google AI Studio và Gemini API.
Công ty poolside công bố bộ đôi mô hình Laguna M.1 và XS.2 với kiến trúc Mixture-of-Experts, được tối ưu hóa cho các tác vụ lập trình và agent dài hạn.
IBM và Hugging Face vừa phát hành các tài liệu kỹ thuật chi tiết về quy trình xây dựng dòng mô hình Granite 4.1, thế hệ LLM được thiết kế đặc thù cho các ứng dụng doanh nghiệp với hiệu năng cao.
MiniMax ra mắt dòng mô hình MoE M2 với 229.9B tham số, tối ưu cho agent và có khả năng tự sửa lỗi mã nguồn của chính mình.
Các mô hình dịch thuật Hunyuan mới của Tencent đang gây sốt trên cộng đồng mã nguồn mở, chiếm giữ các vị trí đầu bảng Trending trên Hugging Face với hơn 7.000 lượt tải xuống chỉ trong thời gian ngắn.
PrismML vừa phát hành dòng mô hình Bonsai Image 4B với công nghệ 1-bit và Ternary, cho phép chạy suy luận khuếch tán (diffusion) chất lượng cao trực tiếp trên phần cứng cục bộ như laptop và smartphone.
NVIDIA giới thiệu PiD (Pixel-in-Diffusion), giải pháp siêu phân giải giúp tăng độ phân giải hình ảnh gấp 4 lần ngay từ không gian latent của mô hình. Công nghệ hỗ trợ FLUX và Z-Image, hứa hẹn tốc độ xử lý vượt trội.
MiMo V2.5-Coder vừa được phát hành, hứa hẹn vượt mặt Qwen 3.6 và DeepSeek 4-Flash khi chạy local trên hệ thống có dung lượng RAM 128 GB.
Mô hình MiniCPM5-1B vừa được mở nguồn hoàn toàn, đạt hiệu suất vượt trội so với các đối thủ dưới 2 tỷ tham số trên bảng xếp hạng Artificial Analysis.
Giới chuyên gia dự báo tháng 6/2026 sẽ là 'tháng điên rồ' của AI với sự ra mắt đồng loạt của Gemini 3.5 Pro, GPT 5.6 và Anthropic Sonnet 4.7.
Chuyên gia nhận định Google vẫn nắm giữ cơ hội lớn để giành lại thị phần AI nếu ra mắt mô hình phân khúc Opus với mức giá tối ưu, thay vì tăng giá theo xu hướng chung.
CEO Abacus AI, Bindu Reddy, chia sẻ danh sách các mô hình AI dẫn đầu hiện nay cho từng nhu cầu cụ thể như lập trình, xử lý hình ảnh và giọng nói thời gian thực.
Alibaba Cloud giới thiệu Qwen3.7-Max với ngữ cảnh 1M token và hiệu năng vượt trội trong lập trình, suy luận và tự chủ dài hạn.
Anthropic vừa tung ra hai cập nhật lớn cho tính năng "auto mode" trên Claude, cho phép các mô hình Sonnet 4.6 và Opus 4.7 tự thực thi tác vụ trực tiếp trên gói Pro.
CEO OpenAI Sam Altman vừa xác nhận phiên bản Codex mới nhất sẽ bắt đầu được triển khai ngay hôm nay, hứa hẹn nâng cấp khả năng lập trình tự động cho AI.
NVIDIA giới thiệu dòng mô hình Nemotron-Labs-Diffusion sử dụng cơ chế diffusion để sinh nhiều token cùng lúc, thay vì sinh từng token đơn lẻ như các mô hình truyền thống.
Bản cập nhật mới nhất của Gemini Omni trên Google Flow mang đến khả năng chỉnh sửa hàng loạt và cải thiện tính nhất quán của nhân vật, giúp tạo ra các câu chuyện hình ảnh mang tính điện ảnh cao.
Các nhà nghiên cứu vừa ra mắt Carbon, mô hình AI chuyên dụng cho DNA với tốc độ xử lý nhanh gấp 275 lần so với các giải pháp hiện nay, cho phép giải mã toàn bộ bộ gen người chỉ trong chưa đầy 2 ngày trên một GPU duy nhất.
Allen Institute for AI giới thiệu OlmoEarth v1.1, dòng mô hình transformer mới cho dữ liệu viễn thám giúp giảm 70% chi phí tính toán nhờ tối ưu hóa cấu trúc token mà không làm suy giảm hiệu năng.
Google giới thiệu Gemini 3.5, dòng mô hình mới nhất được thiết kế để kết hợp khả năng suy luận mạnh mẽ với khả năng thực thi tác vụ trong thế giới thực.
Google DeepMind thông báo triển khai mô hình Gemini 3.5 Flash cho người dùng phổ thông trên ứng dụng Gemini và tính năng AI Mode trong tìm kiếm.
Google DeepMind hé lộ sẽ trình làng các công cụ và đột phá AI định hình tương lai tại sự kiện Google I/O diễn ra vào ngày mai.