Các đặc vụ AI doanh nghiệp đang gặp một lỗi sản xuất mới không phải do mô hình: cùng một dữ liệu cơ bản nhưng lại cho ra các câu trả lời khác nhau tùy thuộc vào đặc vụ, công cụ hay hệ thống nào đặt câu hỏi. Doanh thu có ý nghĩa này trong bảng điều khiển BI, ý nghĩa khác một chút trong bảng SQL, và một ý nghĩa hoàn toàn khác trong hướng dẫn của đặc vụ. Hạ tầng truy xuất phát triển nhanh và rẻ hơn trong hai năm qua nhưng lại không tạo ra một định nghĩa chung về ý nghĩa dữ liệu. 😥
Tại Snowflake Summit 26 ở San Francisco, Snowflake đã đưa ra một giải pháp toàn diện cho vấn đề này, với các thông báo bao gồm dịch vụ phát trực tuyến được quản lý tương thích Kafka (Data Stream), cải tiến tính toán thích ứng, mở rộng khả năng tương tác Apache Iceberg, và cập nhật cho các sản phẩm đặc vụ và lập trình Cowork và CoCo. Nền tảng của tất cả là một lớp ngữ cảnh: Horizon Context và Cortex Sense – một hệ thống hai lớp được thiết kế để cung cấp cho các đặc vụ một định nghĩa logic nghiệp vụ được quản lý và chia sẻ trên các ngăn xếp truy xuất. 💡
Vấn đề ngữ cảnh là cốt lõi: dữ liệu VB Pulse Q1 2026 của VentureBeat, thu thập từ khảo sát các tổ chức có 100 nhân viên trở lên, cho thấy ý định sử dụng truy xuất kết hợp đã tăng gấp ba, từ 10.3% vào tháng 1 lên 33.3% vào tháng 3, trở thành vị trí chiến lược phát triển nhanh nhất trong tập dữ liệu.
Christian Kleinerman, Phó Chủ tịch Điều hành Sản phẩm tại Snowflake, nhận định: "Có rất nhiều công cụ mà bạn có thể đặt câu hỏi, bạn nhận được một câu trả lời rất tự tin, nhưng liệu nó có đúng hay không lại là chuyện khác."
🎯 Từ Logic Nghiệp Vụ Phân Mảnh Đến Lớp Ngữ Cảnh Được Quản Lý
Vấn đề mà Horizon Context nhắm đến rất cụ thể. Hiện nay, logic nghiệp vụ được phân tán trên SQL, các bảng điều khiển BI và hướng dẫn đặc vụ, không có một hệ thống duy nhất nào sở hữu định nghĩa này. Khi nhiều đặc vụ hoặc công cụ truy vấn cùng một dữ liệu cơ bản, chúng lại lý giải dựa trên các lược đồ khác nhau và đưa ra các câu trả lời không đồng nhất. Horizon Context là nỗ lực của Snowflake để khắc phục điều này ở cấp độ danh mục (catalog layer) thay vì cấp độ đặc vụ.
* Horizon Context: Là lớp do khách hàng quản lý, được xây dựng dựa trên việc Snowflake mua lại Select Star. Nó kéo siêu dữ liệu từ Postgres, SQL Server, Tableau và Power BI vào Horizon Catalog, đảm bảo mọi đặc vụ, công cụ BI và hệ thống bên ngoài đều lấy từ cùng một định nghĩa được quản lý, thay vì tự lý giải độc lập trên lược đồ vật lý thô. Tính năng Semantic View Autopilot tự động tạo và tinh chỉnh các chế độ xem ngữ nghĩa theo thời gian, mở rộng logic nghiệp vụ đã được tuyển chọn mà không yêu cầu nỗ lực thủ công liên tục. * Cortex Sense: Là lớp được nền tảng suy luận. Nó tự động xây dựng và làm phong phú ngữ cảnh từ dữ liệu khách hàng và các mẫu sử dụng một cách liên tục, không yêu cầu việc tạo chế độ xem ngữ nghĩa thủ công. Kleinerman mô tả nó như việc cải thiện trải nghiệm mặc định trước khi có bất kỳ sự tuyển chọn rõ ràng nào.
Kleinerman đã rất chính xác khi phân biệt hai lớp này về mặt kiến trúc: "Hãy coi Horizon Context là mọi thứ rõ ràng và được khách hàng khai báo, còn Cortex Sense là mọi thứ ngầm định và được chúng tôi suy luận."
Hai lớp này kết nối với hạ tầng truy xuất hiện có của Snowflake. Cortex Search, triển khai RAG của công ty, tích hợp vào cả CoCo và Cowork như một công cụ, vì vậy ngữ cảnh được làm phong phú bởi bất kỳ lớp nào cũng sẽ chảy vào các quy trình truy xuất.
Mặc dù Horizon Context là công nghệ của Snowflake, mục tiêu là nó phải có khả năng tương tác và mở. Snowflake đang gắn công nghệ này với Open Semantic Interchange, giúp các định nghĩa do khách hàng khai báo có thể di động qua các danh mục và công cụ của bên thứ ba. Kleinerman nhấn mạnh: "Chúng tôi cam kết 100% và đang dẫn đầu nỗ lực để đảm bảo rằng Horizon Context không bị khóa."
🌍 Lớp Ngữ Cảnh Ở Khắp Mọi Nơi: Đâu Mới Là Giải Pháp Hiệu Quả?
Snowflake không đơn độc trong cuộc chiến này. Hiện có rất nhiều nhà cung cấp cũng đang nhắm đến cùng một vấn đề. Microsoft đã mở bản thể học kinh doanh Fabric IQ thông qua MCP để bất kỳ đặc vụ nào của nhà cung cấp nào cũng có thể rút ra từ một lớp ngữ nghĩa chung. Redis ra mắt Iris, một nền tảng ngữ cảnh và bộ nhớ nằm giữa các đặc vụ và dữ liệu của chúng, được xây dựng trên một công cụ lưu trữ được thiết kế lại cho khối lượng truy xuất quy mô đặc vụ. Pinecone đang định vị lại từ cơ sở dữ liệu vector thành công cụ kiến thức với Nexus, biên dịch dữ liệu doanh nghiệp thành các tạo tác cụ thể theo tác vụ trước khi các đặc vụ truy vấn chúng.
Devin Pratt, Giám đốc Nghiên cứu tại IDC, chia sẻ với VentureBeat rằng theo quan điểm của ông, Snowflake đang đi đúng hướng và đi theo xu hướng chung của toàn thị trường. Pratt nói: "Các đặc vụ chỉ tốt khi dữ liệu và ngữ nghĩa đằng sau chúng tốt, vì vậy lớp ngữ cảnh, chứ không phải mô hình, là điều đáng xem hiện tại."
Theo Pratt, điểm mạnh của phiên bản Snowflake nằm ở sự phân chia. Horizon Context bao gồm những gì các nhóm khai báo và tuyển chọn, còn Cortex Sense bao gồm những gì nền tảng tự động thu thập. Quan trọng không kém, họ đã neo Horizon Context vào lớp danh mục và quản trị thay vì gắn thêm vào sau.
Pratt khẳng định: "Lớp ngữ cảnh là chiến trường thực sự cho AI đặc vụ. Một đặc vụ chỉ đáng tin cậy khi dữ liệu và ngữ nghĩa đằng sau nó đáng tin cậy."
Mike Leone, Phó Chủ tịch kiêm Nhà phân tích chính tại Moor Insights and Strategy, đồng ý rằng việc xử lý hai lớp khác nhau là một quyết định kiến trúc đúng đắn. Leone chia sẻ: "Tôi thích hướng đi của Snowflake. Họ đang chia ngữ cảnh thành hai nhóm, với Horizon Context bao gồm những gì khách hàng định nghĩa rõ ràng và Cortex Sense bao gồm những gì nền tảng tự mình tìm ra. Bạn không thể tin tưởng hai điều đó theo cùng một cách, vì vậy việc xử lý chúng khác nhau là một quyết định đúng. Nếu Snowflake có thể cho thấy hai lớp đó đối chiếu sạch sẽ và bạn có thể thấy mọi câu trả lời đến từ đâu, họ đã có một điều gì đó thực sự."
💡 Ý Nghĩa Đối Với Các Doanh Nghiệp
Đối với các doanh nghiệp đang đánh giá các lớp ngữ cảnh, hướng kiến trúc đã rõ ràng. Tuy nhiên, khoảng cách trong việc triển khai vẫn còn.
* Các đặc vụ nâng cao tiêu chuẩn cho một vấn đề cũ: Ý tưởng về lớp ngữ nghĩa đã tồn tại trong nhiều năm, nhưng các đặc vụ thay đổi chi phí của sự thất bại – khi một đặc vụ đưa ra câu trả lời sai ở quy mô lớn, thiệt hại là ngay lập tức. Leone nói thẳng về ý nghĩa của điều đó đối với hầu hết các nhà cung cấp hiện tại trên thị trường:
"Hầu hết các nhà cung cấp bán một giải pháp cắm-và-chạy đều hứa hẹn quá mức," Leone nói. "Khi đưa một giải pháp như vậy vào một doanh nghiệp thực tế, nó chủ yếu phơi bày dữ liệu và định nghĩa đã lộn xộn như thế nào, và rất nhiều công ty sắp nhận ra điều đó một cách khó khăn."
* Tiêu chí đánh giá rất cụ thể: Pratt đã xác định điều gì phân biệt các lớp ngữ cảnh hoạt động hiệu quả với những lớp bị đình trệ: đó là quản trị và truy xuất nguồn gốc được tích hợp để các nhóm có thể kiểm toán lý do đặc vụ đưa ra câu trả lời đó; khả năng di động để ngữ cảnh và chính sách không bị khóa với một nhà cung cấp; và độ chính xác có thể đo lường và tái sử dụng trên các đặc vụ và công cụ.
Pratt kết luận: "Các doanh nghiệp không cần thêm một kho dữ liệu ngữ nghĩa (silo of semantics) khác. Họ cần một lớp ngữ cảnh được quản lý, có khả năng di động và đủ đáng tin cậy để kiểm toán."