Perplexity AI Gây Chấn Động Computex 2026 với Hệ Thống AI Lai Cục Bộ-Đám Mây Tự Động: Dữ Liệu Của Bạn Sẽ Đi Đâu? 🤔
Đài Bắc, Đài Loan – Tại sự kiện Computex 2026, Perplexity AI, startup tìm kiếm đang phát triển nhanh chóng với định giá chóng mặt 20 tỷ USD 📈, đã chính thức ra mắt một công nghệ được họ tuyên bố là "hệ thống điều phối suy luận lai cục bộ-máy chủ" đầu tiên. Phần mềm đột phá này có khả năng tự động quyết định – ngay lập tức và trong quá trình thực hiện tác vụ – những công việc AI nào sẽ được xử lý trên thiết bị của người dùng và những công việc nào sẽ được chuyển đến các mô hình AI tiên tiến trên đám mây. Một bước tiến đầy tham vọng, nhưng liệu có giải quyết được những thách thức hiện tại của công ty?
Điểm Nhấn Công Nghệ: Quyền Riêng Tư Và Hiệu Suất Kết Hợp 🛡️
Giám đốc điều hành Aravind Srinivas đã trình diễn hệ thống này trên sân khấu cùng với CEO Intel Lip-Bu Tan, sử dụng tác nhân "Personal Computer" của Perplexity để xử lý các tài liệu giao dịch mật. Điểm mấu chốt không phải là việc một mô hình có thể chạy cục bộ – điều này đã được hàng chục công cụ khác thực hiện. Thay vào đó, Perplexity nhấn mạnh khả năng hệ thống của họ tự đưa ra quyết định định tuyến, từng tác vụ một, mà không yêu cầu người dùng lựa chọn trước.
Các mô hình cục bộ chạy trên Intel Core Ultra Series 3 sẽ xác định thông tin nào cần giữ lại trên thiết bị và thông tin nào có thể gửi đến các mô hình dựa trên đám mây. Dữ liệu nhạy cảm như hồ sơ tài chính hoặc thông tin sức khỏe sẽ nằm trên máy cục bộ, trong khi các tác vụ suy luận nặng hơn, đòi hỏi sức mạnh của các mô hình tiên tiến, sẽ được gửi lên đám mây. Srinivas khẳng định cách tiếp cận này cân bằng giữa: trí thông minh, độ chính xác, quyền riêng tư và chi phí.
Một phát ngôn viên của Perplexity nói với VentureBeat: "Chưa có sản phẩm nào làm được điều này trước đây." Tuy nhiên, sản phẩm vẫn chưa đến tay người dùng; tính năng suy luận lai này dự kiến sẽ ra mắt trong vài tuần tới.
Hành Trình Đổi Mới Của Perplexity AI: Từ Đám Mây Đến Thiết Bị 🚀
Để hiểu rõ tầm quan trọng của buổi trình diễn tại Computex, cần nhìn lại chặng đường phát triển sản phẩm của Perplexity:
* Tháng 2: Perplexity ra mắt "Computer", một tác nhân AI đa mô hình hoạt động hoàn toàn trên đám mây, điều phối 19 mô hình AI khác nhau (Claude, Gemini, GPT, Grok...) để hoàn thành các tác vụ phức tạp. * Tháng 3: Giới thiệu "Personal Computer" tại hội nghị nhà phát triển Ask 2026. Đây là một ứng dụng Mac mới với hỗ trợ tác nhân AI lai cục bộ-đám mây, đóng vai trò là "điều phối viên cá nhân" kết hợp môi trường cục bộ và máy chủ để tăng cường bảo mật và năng suất.
Điều mà Srinivas trình diễn tại Computex đã mở rộng kiến trúc này một cách căn bản. Trước đây, ngay cả "Personal Computer" cũng phân chia công việc theo những ranh giới tương đối rõ ràng: truy cập tệp cục bộ trên thiết bị, tính toán nặng trên máy chủ của Perplexity. Giờ đây, hệ thống điều phối suy luận lai mới trao cho hệ thống khả năng tự suy luận về nơi mỗi phần của một tác vụ nên được thực thi – không chỉ là mô hình nào, mà là vị trí vật lý nào nên xử lý nó. Hệ thống sẽ hỏi người dùng cấp phép trước khi gửi các tác vụ nhạy cảm lên đám mây, một lựa chọn thiết kế nhằm giải quyết một trong những lo ngại lớn nhất của doanh nghiệp về AI đại diện: quản trị dữ liệu.
Thời Điểm Chiến Lược Và Tác Động Thị Trường 💡
Thời điểm của buổi trình diễn không phải là ngẫu nhiên. Computex 2026 đã bị chi phối bởi một chủ đề duy nhất: AI trên thiết bị (on-device AI). Chỉ vài giờ trước bài phát biểu của Intel, CEO Nvidia Jensen Huang đã công bố RTX Spark, một siêu chip dựa trên Arm được công ty định vị là nền tảng cho thế hệ PC Windows AI-native mới. Về phía Intel, họ cũng đã giới thiệu bộ xử lý Xeon 6+ cho trung tâm dữ liệu và định vị Core Ultra Series 3 là silicon khách hàng giúp suy luận lai khả thi trên PC.
Hệ thống điều phối lai của Perplexity nằm ở giao điểm của cả hai chiến lược này. Nếu hệ thống hoạt động như quảng cáo, nó sẽ tạo ra một động lực kinh tế trực tiếp cho người dùng – và cuối cùng là các doanh nghiệp – đầu tư vào phần cứng cục bộ mạnh mẽ hơn. Con chip trên thiết bị càng mạnh, càng nhiều suy luận có thể chạy cục bộ, giảm chi phí đám mây và cải thiện độ trễ cho các tác vụ nhạy cảm. Điều này mang lại lợi ích cho Nvidia, Intel và tất cả các nhà sản xuất chip khác đang cạnh tranh cho thị trường AI PC.
Ý nghĩa còn vượt xa kinh tế chip. Một phát ngôn viên của Perplexity nói: "Khi chip trở nên mạnh hơn, trí thông minh càng di chuyển vào máy của một người, cùng với suy luận máy chủ cho các tác vụ phức tạp vẫn cần các mô hình tiên tiến. Công việc nhạy cảm và chủ quyền có thể nằm cục bộ, điều này thay đổi nhu cầu về cơ sở hạ tầng cấp quốc gia." Tuyên bố cuối cùng này – về cơ sở hạ tầng chủ quyền – là điều gây tranh cãi nhất. Các quốc gia từ UAE đến Pháp, Ấn Độ đã đầu tư hàng tỷ USD vào năng lực tính toán AI trong nước một phần dựa trên giả định rằng dữ liệu nhạy cảm phải nằm trong biên giới của họ. Nếu suy luận có ý nghĩa có thể chạy trên thiết bị của người dùng cuối mà không cần dữ liệu rời khỏi máy, thì bài toán sẽ thay đổi. Nó không loại bỏ nhu cầu về trung tâm dữ liệu, nhưng có thể làm giảm mức độ khẩn cấp của việc xây dựng.
Kiến Trúc Độc Đáo: Lớp Điều Phối Quan Trọng Hơn Bản Thân Mô Hình 🧠
Chiến lược suy luận lai của Perplexity dựa trên cùng một nền tảng kiến trúc mà công ty đã theo đuổi cả năm: lớp điều phối quan trọng hơn bất kỳ mô hình riêng lẻ nào. Đối với các kỹ sư AI, đây là một sự thay đổi cơ bản – lớp điều phối có thể quan trọng hơn bản thân các mô hình.
Quan điểm chính là sự phân tách các mối quan tâm: lớp điều phối xử lý việc phân tách tác vụ, quản lý trạng thái và phối hợp công cụ, trong khi lớp mô hình xử lý các tính toán cụ thể. Việc tách biệt này có nghĩa là các nhóm có thể thay đổi mô hình khi có các lựa chọn tốt hơn mà không cần thiết kế lại toàn bộ hệ thống.
Perplexity đã đẩy mạnh triết lý này, tập trung vào việc đóng gói các mô hình tiên tiến trong trải nghiệm người dùng thân thiện, cho rằng có giá trị trong việc điều phối nhiều LLM của bên thứ ba để có được câu trả lời hiệu quả và chính xác nhất cho các truy vấn. Theo Perplexity, các mô hình đang chuyên môn hóa, chứ không phải trở thành hàng hóa.
Phần mở rộng suy luận lai đưa logic đó đi xa hơn một bước. Perplexity hiện đang điều phối không chỉ giữa các mô hình mà còn giữa các vị trí tính toán vật lý – chọn mô hình nào chạy ở đâu. Một mô hình cục bộ nhẹ có thể xử lý tác vụ tóm tắt tài liệu nhạy cảm về quyền riêng tư, trong khi một mô hình đám mây tiên tiến giải quyết các suy luận phức tạp cần thiết để phân tích bản tóm tắt đó trong bối cảnh thị trường rộng lớn hơn. Người điều phối quản lý việc chuyển giao này.
Đây là một tuyên bố đầy tham vọng về mặt kỹ thuật. Để hoạt động đáng tin cậy trong thực tế, hệ thống điều phối sẽ cần đánh giá chính xác độ phức tạp của mỗi tác vụ phụ, hiểu độ nhạy cảm của dữ liệu liên quan, biết khả năng và đặc điểm độ trễ của phần cứng cục bộ mà người dùng có, và quản lý trạng thái của một tác vụ có thể luân chuyển giữa các môi trường trong quá trình thực thi. Dễ dàng hình dung các trường hợp ngoại lệ nơi logic định tuyến thất bại, gửi thông tin nhạy cảm lên đám mây hoặc làm giảm hiệu suất bằng cách gán một tác vụ cho một mô hình cục bộ yếu kém. Perplexity cho biết hệ thống sẽ không phụ thuộc vào chip, mặc dù bản demo ban đầu tại Computex chạy trên silicon của Intel.
Áp Lực Kinh Doanh Và Pháp Lý Chồng Chất ⚖️
Thông báo về suy luận lai của Perplexity đến vào thời điểm khá phức tạp. Công ty đã trải qua quỹ đạo tăng trưởng đáng kinh ngạc: huy động 200 triệu USD vốn mới với định giá 20 tỷ USD, chỉ hai tháng sau khi huy động 100 triệu USD với định giá 18 tỷ USD. Kể từ khi thành lập ba năm trước, Perplexity đã huy động tổng cộng 1,5 tỷ USD theo dữ liệu của PitchBook. Tuy nhiên, mặt khác, công ty cũng đối mặt với chín vụ kiện đang hoạt động về cáo buộc vi phạm bản quyền và nhãn hiệu tính đến ngày 31 tháng 5 năm 2026. Các nguyên đơn bao gồm các "ông lớn" như: CNN, New York Times, News Corp và Dow Jones, New York Post, Chicago Tribune, Encyclopedia Britannica, Merriam-Webster, Reddit, và Yomiuri Shimbun của Nhật Bản. Perplexity đã phản hồi bằng một thông điệp nhất quán: "Bạn không thể bản quyền sự thật." 🗣️
Một số nhà xuất bản khác đã chọn hợp tác thay vì kiện tụng. Time, Gannett, Le Monde và Der Spiegel đã ký thỏa thuận cấp phép với Perplexity. Công ty đã ra mắt Chương trình Đối tác Nhà xuất bản vào giữa năm 2024, trong đó các đối tác nhận được một phần doanh thu khi nội dung của họ được trích dẫn trong các câu trả lời của Perplexity. Rủi ro pháp lý không phải là nguy cơ hủy diệt, nhưng nó là vật chất, và với việc các doanh nghiệp ngày càng đánh giá công cụ của Perplexity cho các quy trình làm việc nhạy cảm – chính là trường hợp sử dụng mà hệ thống suy luận lai được thiết kế để phục vụ – các câu hỏi về sở hữu trí tuệ chưa được giải quyết có thể làm giảm sự chấp nhận.
Tham Vọng Doanh Nghiệp Của Perplexity 💼
Bản demo suy luận lai nên được xem xét cùng với việc Perplexity đẩy mạnh hơn vào phần mềm doanh nghiệp, một sự chuyển đổi đã tăng tốc đáng kể trong năm nay. Tại hội nghị Ask 2026 vào tháng 3, Perplexity đã công bố "Computer for Enterprise", định vị startup ba năm tuổi này là đối thủ cạnh tranh trực tiếp với Microsoft, Salesforce và các hệ thống phần mềm doanh nghiệp truyền thống.
Suy luận lai làm sâu sắc thêm đề xuất giá trị này cho doanh nghiệp. Đối với các ngành được quản lý – dịch vụ tài chính, chăm sóc sức khỏe, quốc phòng, pháp lý – khả năng giữ dữ liệu nhạy cảm trên thiết bị cục bộ trong khi vẫn truy cập sức mạnh suy luận của các mô hình đám mây tiên tiến không chỉ là "điểm cộng". Đó là một yêu cầu tuân thủ tiềm năng. Một ngân hàng đầu tư phân tích tài liệu giao dịch mật, chẳng hạn, có thể không thể gửi những tài liệu đó đến đám mây của bên thứ ba theo các thỏa thuận xử lý dữ liệu hiện có. Một hệ thống có thể chạy việc phân tích nhạy cảm cục bộ trong khi định tuyến các tác vụ phân tích không nhạy cảm lên đám mây mang đến một giải pháp trung gian.
Cuộc Đua AI: Nơi Xử Lý Dữ Liệu Vẫn Là Ẩn Số 🏁
Nhiều câu hỏi sẽ quyết định liệu buổi trình diễn của Perplexity tại Computex có trở thành một sản phẩm mang tính bước ngoặt hay chỉ là một nguyên mẫu hấp dẫn.
* Hiệu suất thực tế vẫn chưa được kiểm nghiệm bên ngoài môi trường sân khấu có kiểm soát – cách logic định tuyến xử lý các cấu hình phần cứng đa dạng, kết nối mạng không ổn định và phân loại độ nhạy dữ liệu không rõ ràng vẫn là một câu hỏi mở. * Phản ứng từ đối thủ cạnh tranh cũng rất quan trọng: Google, Microsoft, Apple và OpenAI đều đang xây dựng kiến trúc AI cục bộ-đám mây của riêng họ. Apple Intelligence đã định tuyến một số tác vụ cục bộ và một số đến máy chủ Private Cloud Compute, Gemini Nano của Google chạy trên thiết bị, và Copilot+ PCs của Microsoft được thiết kế xoay quanh khả năng suy luận cục bộ. Tuy nhiên, không có hệ thống nào trong số này hiện cung cấp loại định tuyến cấp tác vụ năng động, tự động mà Perplexity tuyên bố.
Ngay cả khi công nghệ hoạt động như đã trình diễn, vẫn còn câu hỏi liệu doanh nghiệp có thể theo kịp tham vọng hay không. Với định giá 20 tỷ USD và doanh thu định kỳ hàng năm khoảng 200 triệu USD, Perplexity đang giao dịch ở mức gấp khoảng 100 lần doanh thu, một mức phí bảo hiểm đòi hỏi tăng trưởng mạnh mẽ để biện minh. Mục tiêu doanh thu 656 triệu USD vào năm 2026 của ban quản lý ngụ ý tăng trưởng 230%, tạo ra áp lực thực thi đáng kể.
Perplexity đã xây dựng công việc kinh doanh của mình dựa trên một đặt cược rằng tương lai không thuộc về bất kỳ mô hình nào mà thuộc về hệ thống điều phối tất cả chúng. Tại Computex, họ đã mở rộng đặt cược đó từ lớp phần mềm sang lớp vật lý – từ mô hình nào đến máy nào. Trong cuộc đua không ngừng của ngành AI để xây dựng các trung tâm dữ liệu lớn hơn và đào tạo các mô hình lớn hơn, Perplexity vừa lập luận rằng chiếc máy tính quan trọng nhất trong hệ thống có thể là chiếc đang nằm trên bàn làm việc của bạn. 🎯