Tuần này, tại hội nghị Build 2026, Microsoft đã gửi đi một thông điệp rõ ràng: các tác nhân AI (AI agents) đang nhanh chóng được đưa vào ứng dụng trong các hệ thống doanh nghiệp. Nền tảng chiến thắng sẽ là nơi cung cấp cho chúng ngữ cảnh đáng tin cậy, khả năng quản trị, nhận diện, bộ nhớ và quyền truy cập dữ liệu doanh nghiệp một cách an toàn. 🚀
Công ty cũng công bố Microsoft IQ như một lớp ngữ cảnh xuyên suốt GitHub Copilot, Microsoft Foundry và Copilot Studio; API Work IQ sẽ ra mắt vào ngày 16 tháng 6; Fabric IQ cho dữ liệu kinh doanh có cấu trúc; Foundry IQ để truy xuất kiến thức doanh nghiệp và web trực tuyến; và Web IQ như một stack tìm kiếm web mới dành cho tác nhân.
Bên cạnh đó, Microsoft còn giới thiệu Scout, một tác nhân làm việc cá nhân, và đáng chú ý là bảy mẫu AI nội bộ mới trong gia đình MAI đang phát triển, bao gồm MAI-Thinking-1, phủ khắp các phương thức và trường hợp sử dụng.
Marco Casalaina: "Nhà Tương Lai Học AI" Tiên Phong của Microsoft 💡
Những thông báo này nằm ngay trong tầm chuyên môn của Marco Casalaina, Phó Chủ tịch Sản phẩm, AI Core và Nhà tương lai học AI của Microsoft. Ông dẫn dắt nhóm AI Futures và trước đây đã lãnh đạo các nhóm trong Azure AI. Với hơn bốn năm tại Microsoft, ông là người đầu tiên trải nghiệm mọi thứ mới mẻ tại đây, tự nhận mình là một "người khả thi kế cận" (adjacent possiblist) tập trung vào tương lai gần, khoảng một năm tới.
Chiến Lược Tác Nhân AI Toàn Diện của Microsoft
Về chiến lược tác nhân AI, Casalaina chia sẻ cái nhìn từ dưới lên:
* Cam kết Đa dạng Mô hình: Microsoft cam kết cung cấp đa dạng mô hình. Bên cạnh các mô hình tiên phong GPT của OpenAI và Claude của Anthropic (hiện đã có Claude Opus 4.8 trên Azure Foundry), Microsoft còn giới thiệu các mô hình MAI tự phát triển. Các mô hình MAI được tối ưu hóa cho hiệu quả token, khả năng tùy chỉnh và được thiết kế đặc biệt để khách hàng tùy chỉnh trên bộ dữ liệu riêng của họ. * Tác Nhân Được Lưu Trữ trong Foundry (Hosted Agents): Đây là khả năng tác nhân được quản lý trong Foundry, tự động xử lý việc mở rộng quy mô, đóng gói (containerization) và quản lý môi trường tác nhân. * Mặt Phẳng Điều Khiển Foundry (Foundry Control Plane): Cho phép doanh nghiệp kiểm soát các tác nhân đã xây dựng, cung cấp khả năng quan sát về chi phí, số lượng token, độ chính xác, đánh giá liên tục và đảm bảo tác nhân hoạt động hiệu quả mà không bị "trôi dạt". * Hệ Sinh Thái IQ – Ngữ Cảnh Cho Tác Nhân: Điểm nhấn lớn là sự ra mắt chính thức (GA) của các IQ. Các IQ này (Foundry IQ, Fabric IQ, Work IQ, Web IQ) đều là 'headless' – chúng cung cấp các loại ngữ cảnh khác nhau cho tác nhân, chủ yếu để các nhà phát triển và tác nhân mà họ xây dựng tương tác. Work IQ tích hợp với hệ sinh thái Microsoft (Outlook, Teams, Word, SharePoint), trong khi Web IQ là khả năng tìm kiếm web mới dành riêng cho tác nhân, siêu nhanh và không giao diện người dùng truyền thống. * Agent Optimizer: Công cụ này bao gồm một loại đánh giá mới, cho phép đánh giá tác nhân một cách chi tiết hơn và tự động điều chỉnh lời nhắc (prompt) để cải thiện hiệu suất hoạt động của tác nhân. 🔄
Microsoft: "Hyperscaler", Nhà Phát Triển Mô Hình và Cầu Nối 🛡️
Casalaina khẳng định Microsoft vừa là một nhà cung cấp hạ tầng đám mây (hyperscaler) khổng lồ, vừa là một công ty phát triển mô hình, và là cầu nối giữa các mô hình với sản phẩm làm việc. Microsoft cung cấp các mô hình từ OpenAI, Anthropic, Mistral, và cả các mô hình MAI do đội ngũ AI Superintelligence của Mustafa Suleyman phát triển. Các mô hình MAI tập trung vào tối ưu hóa, hiệu quả token và khả năng tùy chỉnh, giải quyết nhu cầu khách hàng về tinh chỉnh và đào tạo trước liên tục trên dữ liệu riêng mà vẫn đảm bảo nguồn gốc dữ liệu minh bạch.
Ngoài ra, Foundry còn hỗ trợ các framework điều phối tác nhân phổ biến như LangGraph, LangChain hay CrewAI, biến chúng thành "tác nhân Foundry hạng nhất" với đầy đủ khả năng quan sát, đánh giá và theo dõi từ mặt phẳng điều khiển Foundry.
Ứng Dụng Thực Tế và Triết Lý "Trao Quyền Cho Con Người" 💡
Casalaina nhận thấy số lượng mô hình AI được sử dụng trong doanh nghiệp sẽ tiếp tục mở rộng, không chỉ tập trung vào số lượng token mà còn vào giá trị nhận được từ mỗi token. Ông dẫn chứng sự tăng trưởng 6 lần về số người dùng hàng tháng của Microsoft 365 Copilot (hơn 20 triệu người dùng) và các ứng dụng thực tế tại Bayer (20.000 nhân viên sử dụng hệ thống tác nhân riêng) hay AEMO (nhà điều hành thị trường năng lượng Úc) sử dụng tác nhân để quản lý lưới điện, giúp lọc hàng tỷ cảnh báo thành thông tin dễ quản lý và hành động hơn.
Triết lý của Microsoft là "trao quyền cho con người" (human empowerment), loại bỏ những công việc lặp đi lặp lại hoặc "công việc tay chân". AI đang vượt ra khỏi việc chỉ trả lời câu hỏi để thực sự giúp đỡ con người trong công việc một cách có ý nghĩa.
Quan Sát, Quản Trị và ROI trong Microsoft Foundry 📊
Mặt phẳng điều khiển Foundry, ra mắt từ tháng 11 năm ngoái, là trung tâm cho khả năng quan sát, tokenomics, phân tích ROI và quản trị tác nhân. Nó cung cấp cái nhìn toàn diện về các tác nhân đang chạy, chi phí, mức sử dụng token, xu hướng và tích hợp với quản lý chi phí Azure tổng thể.
Để nâng cao khả năng quản trị, Microsoft đang phát hành tính năng đánh giá dựa trên tiêu chí (rubric-based evaluation) ở dạng preview. Tính năng này cho phép kiểm tra tác nhân một cách chi tiết và cụ thể hơn. Ví dụ, với tác nhân đặt bàn nhà hàng, thay vì chỉ kiểm tra "độ tin cậy" (groundedness), hệ thống sẽ đánh giá xem tác nhân có hỏi thời gian mong muốn hay kiểm tra tính khả dụng của bàn trước khi xác nhận hay không. Mục tiêu là đảm bảo tác nhân hoạt động đúng theo kịch bản mong muốn, không chỉ đơn thuần là "hoạt động".
Sức Mạnh của Microsoft 365 Copilot ✍️
Microsoft 365 Copilot là một lợi thế lớn, là giao diện chính để người dùng tương tác với các tác nhân tùy chỉnh. Casalaina chia sẻ rằng ông sử dụng Copilot "có lẽ 50 lần một ngày" để soạn email, quản lý lịch và tìm kiếm thông tin. Ông kể lại việc Copilot giúp ông soạn email trả lời khách hàng chỉ trong một phút, bằng cách tìm kiếm thông tin từ Teams, email và các cuộc họp, sử dụng Work IQ để tổng hợp và soạn thảo theo văn phong riêng của ông. Điều này thực sự "trả lại thời gian" cho người dùng, không chỉ loại bỏ công việc lặp lại mà còn tiết kiệm hàng giờ tìm kiếm thông tin và thực hiện các hành động phức tạp.
AI Thay Đổi Công Việc và Cuộc Sống Cá Nhân
Marco Casalaina không sợ mất việc mà thay vào đó, công việc của ông đã thay đổi và ông làm được nhiều việc hơn. Ông thậm chí còn sử dụng Web IQ mới trong cuộc sống cá nhân để tìm kiếm mẫu xe Hyundai Ioniq 6 cụ thể trong khu vực Bay Area, tiết kiệm hàng giờ tra cứu thủ công. 🏎️
Thông điệp cuối cùng dành cho các nhà phát triển: Foundry chính là nơi lý tưởng để xây dựng, mở rộng quy mô, kiểm tra và cải thiện các tác nhân AI của bạn. Đó là tất cả những gì đang diễn ra! 💪