Google DeepMind hợp tác với EVE Online để huấn luyện AI trong vũ trụ ảo
Google DeepMind bắt tay với các nhà phát triển game EVE Online, sử dụng vũ trụ phức tạp này làm 'sandbox' để thử nghiệm khả năng ghi nhớ và lập kế hoạch dài hạn của các agent.
Tag
Tổng hợp 45 bài Kalera News liên quan đến AI Agent — viết tiếng Việt, có dẫn nguồn gốc.
Google DeepMind bắt tay với các nhà phát triển game EVE Online, sử dụng vũ trụ phức tạp này làm 'sandbox' để thử nghiệm khả năng ghi nhớ và lập kế hoạch dài hạn của các agent.
Google DeepMind trình diễn khả năng hiểu ngữ cảnh của con trỏ chuột AI, biến một mẩu ghi chú viết tay thành danh sách công việc hoặc đặt bàn nhà hàng từ video.
OpenAI đưa ra thêm lý do để người dùng chuyển sang sử dụng Codex, nhấn mạnh vào khả năng tự động hóa và tích hợp sâu của nền tảng này.
Anthropic tung ra bản nâng cấp Claude Opus 4.8 với chế độ 'Fast Mode' rẻ hơn 3 lần và khả năng suy luận vượt trội, tiệm cận dòng model bảo mật Mythos.
Phân tích kiến trúc cốt lõi của tác tử tự trị (AI Agent) dùng LLM làm bộ não, giúp giải quyết các bài toán phức tạp thông qua lập kế hoạch, trí nhớ và công cụ.
Clawpatch không chỉ là trợ lý viết code mà hoạt động như một AI Engineer thực thụ, tự động quét dự án theo tính năng và thực hiện các bản vá (patch) được kiểm chứng qua bộ test.
PostTrainBench v1.0 cung cấp bộ tiêu chuẩn mới để đo lường khả năng của các AI agent trong việc thực hiện các nhiệm vụ hậu đào tạo cho mô hình ngôn ngữ.
Kaggle ra mắt thử thách 'Kaggriculture', bài tập cuối khóa cho khóa học AI Agents cấp tốc kéo dài 5 ngày hợp tác cùng các kỹ sư Google DeepMind.
Chip Huyen chia sẻ những quan sát từ Agentic Hackathon, nhấn mạnh vào các thách thức cốt lõi như quản lý bộ nhớ, phục hồi sau lỗi và duy trì tính nhất quán của sub-agents.
Google DeepMind giới thiệu hệ thống AI Co-Mathematician giúp các nhà toán học giải quyết các bài toán nghiên cứu mở thông qua sự phối hợp giữa người và các agent AI.
Sail Research đang phát triển hạ tầng inference tập trung vào throughput nhằm phục vụ các AI agent thực thi tác vụ dài hạn (long-horizon agents).
Sự hợp tác này nhằm thiết kế các pipeline huấn luyện mới, cho phép các tác vụ AI agent khám phá và thúc đẩy những bước tiến mới trong khoa học và công nghiệp.
Microsoft phát hành báo cáo WorkTrendIndex 2026, nhấn mạnh khi AI đảm nhận việc thực thi, con người có thêm không gian để phát triển năng lực sáng tạo và quản lý.
Khoảnh khắc OpenClaw được coi là bước ngoặt quan trọng khi lần đầu tiên những người không chuyên môn được trải nghiệm sức mạnh thực sự của các mô hình agentic thay vì chỉ coi AI là chatbot.
DeepMind giới thiệu AlphaEvolve, một coding agent sử dụng sức mạnh của Gemini để tối ưu hóa hiệu suất lập trình trong nghiên cứu khoa học và hạ tầng doanh nghiệp.
Loạt nghiên cứu mới về AI Agent tập trung vào tính khả thi vật lý (BrickAnything) và việc duy trì hiệu suất dài hạn cho hệ thống.
Nghiên cứu mới từ Microsoft chỉ ra các lỗ hổng nghiêm trọng khi AI agent tự động tương tác ở quy mô lớn và không tối ưu được lợi ích thực tế cho người dùng.
Microsoft Research công bố MagenticLite, bộ khung AI Agent được tối ưu hóa cho các mô hình ngôn ngữ nhỏ (SLM), cho phép thực thi tác vụ mượt mà giữa trình duyệt và máy tính cục bộ.
Vercel Sandbox hiện cho phép chạy Claude Managed Agents trong môi trường microVM Firecracker cô lập, kết hợp khả năng quản lý của Anthropic với hạ tầng bảo mật của Vercel.
Firecrawl chính thức có mặt trên Vercel Marketplace, cung cấp giải pháp thu thập dữ liệu web tối ưu cho LLM mà không cần quản lý hạ tầng crawler phức tạp.
Báo cáo mới cho thấy khoảng cách lớn giữa tham vọng triển khai AI Agent của các doanh nghiệp và năng lực hạ tầng, vận hành thực tế hiện nay.
VentureBeat nhận định rào cản lớn nhất hiện nay của AI Agent trong doanh nghiệp không nằm ở mô hình ngôn ngữ, mà ở hệ thống phân quyền (permissions) và quản trị dữ liệu.
Spotify vừa cho phép các tác nhân AI như OpenClaw tự động hóa quy trình sản xuất, biên tập và xuất bản nội dung podcast cá nhân hóa trực tiếp trên nền tảng.
Việc mua lại StackAI giúp Asana tích hợp sâu khả năng xây dựng AI Agent tùy chỉnh vào nền tảng quản lý công việc, tăng cường tự động hóa quy trình.
Tiến sĩ Jim Fan (NVIDIA) cảnh báo về nguy cơ AI agent bị lợi dụng để chiếm đoạt danh tính và phát tán mã độc thông qua các tập tin cấu hình như ~/.claude hoặc mã nguồn kỹ năng.
GitHub đang thử nghiệm một AI agent chuyên biệt giúp tự động nhận diện và khắc phục các rào cản về giao diện người dùng, hướng tới nền tảng lập trình hòa nhập hơn.
Vercel vừa cập nhật Chat SDK, tích hợp sâu bộ công cụ AI SDK và cho phép truy cập trực tiếp vào SDK của các nền tảng như GitHub, Slack và Linear để xây dựng AI agent.
Figma chính thức nâng cấp công cụ Make, cho phép đồng bộ hai chiều với kho code GitHub, giúp designer có thể đẩy thay đổi thẳng vào sản phẩm thật.
CLI-Anything là nền tảng giúp AI agent điều khiển các phần mềm truyền thống thông qua giao diện dòng lệnh chuẩn hóa, biến mọi ứng dụng thành 'agent-native'.
AgentKit SEO là framework sử dụng AI agent để tự động hóa và đồng bộ hóa nội dung CV, LinkedIn và GitHub README theo phong cách chuyên nghiệp.
Conductor, một IDE hỗ trợ đa agent (multi-agent), vừa chuyển lớp thực thi từ máy cục bộ sang đám mây thông qua Vercel Sandbox. Giải pháp này giúp các đội ngũ kỹ sư có thể chạy hàng loạt AI agent lập trình song song mà không bị giới hạn bởi phần cứng.
Cognition, startup phát triển lập trình viên AI Devin, vừa nâng định giá lên 2,6 tỷ USD chỉ sau chưa đầy 9 tháng. Khoản đầu tư mới cho thấy niềm tin mãnh liệt của giới công nghệ vào khả năng tự động hóa lập trình của các AI agent.
Mistral chính thức đổi tên chatbot LeChat thành Vibe, đánh dấu bước chuyển từ giao diện chat đơn thuần sang một agent hỗ trợ công việc toàn diện.
Nghiên cứu mới giới thiệu khung SMARt giúp các AI agent tự nhận diện lỗi, tạm dừng hoạt động và chuyển giao quyền kiểm soát khi độ tin cậy giảm sút.
Các đợt ra mắt của NVIDIA Nemotron 3 Nano Omni và DeepSeek-V4 đánh dấu bước tiến quan trọng trong việc xử lý siêu ngữ cảnh cho các tác vụ AI agent đa phương tiện.
cmux là trình giả lập terminal trên macOS được xây dựng trên Ghostty, nổi bật với tính năng vòng thông báo (Notification rings) giúp theo dõi trạng thái hoạt động của các AI agent như Claude Code hay Aider một cách trực quan.
Garry Tan, CEO của Y Combinator, ra mắt gstack — tập hợp 23 chuyên gia ảo giúp biến các AI agent như Claude Code thành một đội ngũ kỹ sư thực thụ, tăng hiệu suất lập trình lên hàng trăm lần.
Một bảng thuật ngữ mới giúp làm sáng tỏ các khái niệm kỹ thuật quan trọng trong việc xây dựng AI Agent, từ bộ khung vận hành đến kỹ thuật xử lý ngữ cảnh.
Giải pháp mã nguồn mở cho phép AI agent truy cập transcript và metadata của YouTube cục bộ mà không cần API key hay tài khoản.
Sutando là trợ lý AI cá nhân cho macOS có khả năng tự học hành vi người dùng và tự động hóa tác vụ phức tạp bằng cách tận dụng thuê bao Claude Code sẵn có.
The Knowledge Guy giúp bạn biến bất kỳ tài liệu PDF hoặc EPUB nào thành "kỹ năng" Claude Code có cấu trúc, cho phép bạn đặt câu hỏi và nhận câu trả lời từ toàn bộ thư viện sách của mình một cách thông minh.
OpenHuman là một nền tảng AI mã nguồn mở cho phép chạy các mô hình ngôn ngữ lớn (LLM) cục bộ, ưu tiên bảo mật dữ liệu và cá nhân hóa trải nghiệm trợ lý thông minh.
Đội ngũ phát triển Claude vừa công bố hướng dẫn chi tiết về cách tối ưu hóa tính năng điều khiển máy tính (Computer Use) để đạt độ tin cậy cao trong môi trường thực tế.
Caleb Fahlgren từ Hugging Face nhấn mạnh tầm quan trọng của việc lưu trữ tập trung các 'traces' (vết tích thực thi) khi AI coding agent ngày càng đưa ra nhiều quyết định quan trọng.
Một phương pháp mới sử dụng tổ hợp các mô hình AI đỉnh cao như Opus 4.7 và GPT 5.5 giúp tạo ứng dụng di động hoàn chỉnh chỉ với một câu lệnh, không cần thiết lập database hay backend.