General Intuition "Đổ" 2.3 Tỷ USD: Game Có Thể Huấn Luyện AI Cho Thế Giới Thực? 🤖
Bước vào văn phòng nghiên cứu và phát triển của General Intuition tại New York, tôi đã được CEO Pim de Witte, 31 tuổi, giới thiệu ngay về một màn hình hiển thị game Fortnite. Điều đáng kinh ngạc là người chơi không phải là con người, mà là một tác nhân AI đã "cày" liên tục 100 giờ. 🎮 Ngay sau đó, một robot bốn chân khổng lồ xuất hiện, và điều khiến tôi bất ngờ hơn nữa là: "Bộ não điều khiển tác nhân chơi game cũng chính là bộ não điều khiển robot này", de Witte tiết lộ.
Con robot, với một camera duy nhất, di chuyển khá vụng về nhưng đầy tò mò, khám phá văn phòng. Điều thú vị là nó chỉ mất 8 phút dữ liệu từ thế giới thực (thu thập ngoài đường phố) để tinh chỉnh mô hình AI điều khiển nó. Đây chính là tầm nhìn cốt lõi của General Intuition: phát triển một mô hình tác nhân có thể tổng quát hóa từ gameplay sang môi trường mô phỏng và cuối cùng là thể hiện trong thế giới vật lý.
Với một tầm nhìn táo bạo như vậy, không khó hiểu khi General Intuition đã thu hút sự chú trợ lớn. Vào thứ Năm, General Intuition xác nhận đã huy động được 320 triệu USD với định giá 2.3 tỷ USD, nâng tổng số vốn công khai lên 454 triệu USD kể từ khi ra mắt vào tháng 10 năm ngoái. 💰
Game Chơi Không Chỉ Là Giải Trí: Nền Tảng Dữ Liệu Độc Quyền
General Intuition được tách ra từ Medal – một công ty khác của de Witte, cho phép game thủ tải lên và chia sẻ các clip chơi game. Hàng trăm triệu giờ chơi game được tải lên đã trở thành tập dữ liệu ban đầu khổng lồ để huấn luyện mô hình của General Intuition về khả năng suy luận không gian-thời gian.
Tuy nhiên, yếu tố then chốt không chỉ là footage gameplay đơn thuần mà là các "nhãn hành động" (action labels) được nhúng trong các clip đó: ghi lại chính xác người chơi đã nhấn nút nào và khi nào. De Witte lập luận rằng, hầu hết các đối thủ đang cố gắng suy luận hành động chỉ từ video, điều này là không đủ.
> "Chúng tôi xem đây là giai đoạn tiếp theo của quá trình tiền huấn luyện," de Witte chia sẻ. "Chúng tôi có một mô hình duy nhất có thể phản ứng với thông tin trên màn hình Fortnite và thực hiện hành động, nhưng cũng có thể đối phó với động lực thế giới thực theo cách mà một mô hình ngôn ngữ lớn (LLM) không bao giờ làm được." 🧠
Trong một buổi demo, mô hình thế giới của General Intuition, một môi trường mô phỏng được tạo ra từng khung hình, đã chứng minh khả năng học hỏi đáng kinh ngạc. Từ hàng triệu giờ chơi game, mô hình này đã "học" được rằng tường là tường, thang dùng để leo và bóng tối dài ra khi mặt trời di chuyển – một sự hiểu biết sâu sắc về vật lý môi trường mà không phải mô hình nào cũng có.
"Phòng Gym" Ảo Cho AI Tương Lai & Thách Thức Thực Tế
Đối với General Intuition, mô hình thế giới (world model) này không phải là sản phẩm cuối cùng; nó là môi trường huấn luyện, hay còn gọi là "phòng gym" nội bộ. Mục tiêu cuối cùng của công ty là bán chính mô hình tác nhân AI. De Witte nhấn mạnh rằng dữ liệu hành động được nhúng trong gameplay giúp mô hình phân biệt "bản thân" với "môi trường", mang lại sự hiểu biết sâu sắc hơn về mối quan hệ nhân-quả.
Mặc dù công nghệ của General Intuition rất ấn tượng trong các buổi trình diễn, công ty không đơn độc trong việc giải quyết bài toán này. Hơn nữa, việc khiến một mô hình như vậy hoạt động ổn định và ở quy mô lớn trong thế giới vật lý vẫn là một thách thức chưa ai giải quyết được triệt để. Hầu hết các phương pháp tiếp cận tương tự đòi hỏi lượng lớn dữ liệu thế giới thực, thu thập chậm và tốn kém. Cược lớn của General Intuition là gameplay chính là một "phím tắt" có khả năng mở rộng.
Nhà Đầu Tư "Khủng" Đặt Niềm Tin Vào Tầm Nhìn Thế Hệ
Các nhà đầu tư của General Intuition hoàn toàn đồng tình với canh bạc này. Vòng gọi vốn mới nhất của General Intuition được dẫn dắt bởi Khosla Ventures, cùng sự tham gia của các tên tuổi lớn như General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg, và các nhà nghiên cứu từ Google DeepMind cùng MIT. 🚀
Phần lớn số vốn sẽ được dùng để mở rộng năng lực tính toán (compute capacity). General Intuition đã có thỏa thuận với CoreWeave và dự định tập trung vào việc tiền huấn luyện phiên bản tiếp theo của mô hình. Một phần nhỏ cũng được dành cho việc mở rộng quyền truy cập API vào cuối mùa hè này.
Ông Vinod Khosla, người đứng đầu Khosla Ventures, chia sẻ rằng ông bị thu hút bởi tầm nhìn của de Witte và vị thế dữ liệu độc quyền của công ty:
> "Trong các mô hình thế giới, tôi nghĩ bước nhảy vọt định lượng chính là sự xuất hiện của trực giác trong AI, một khả năng giống trực giác con người. Dữ liệu hành động và phản ứng của con người trong trò chơi là phần then chốt cho sự xuất hiện của trực giác."
Khosla tin rằng General Intuition có thể trở thành xương sống cho các tác nhân và mô hình thế giới tổng quát, không phải là một mục tiêu mua lại. "Ở thời điểm này, đó sẽ là một thương vụ mua lại dữ liệu, điều đó hơi không thú vị," ông nói.
Đạo Đức Định Hướng Phát Triển và Tầm Nhìn Cộng Đồng
Phần của canh bạc lớn này cũng liên quan đến việc tin tưởng vào các giá trị của de Witte. Với ba năm kinh nghiệm trong lĩnh vực nhân đạo, bao gồm cả Tổ chức Bác sĩ Không Biên giới, de Witte đã vạch ra một ranh giới rõ ràng về cách thức công nghệ của General Intuition sẽ được sử dụng: không tác nhân nào được dùng để gây hại cho con người. 🛡️
> "Chúng tôi không muốn trở thành một phần gây leo thang căng thẳng của hệ thống," de Witte khẳng định.
Dù Thung lũng Silicon ngày càng hào hứng với các ứng dụng quân sự, de Witte vẫn sẵn lòng để các mô hình của mình được sử dụng cho các nhiệm vụ tìm kiếm và cứu nạn.
Tấm lòng của de Witte không chỉ dừng lại ở việc giới hạn những gì mô hình không làm được. Là một game thủ từng kiếm 1.5 triệu USD từ việc xây dựng máy chủ RuneScape riêng khi còn thiếu niên, de Witte cũng trăn trở về những người có thể bị bỏ lại phía sau bởi sự phát triển của AI.
Gần đây, General Intuition đã ra mắt nền tảng Nerve – một thị trường việc làm cho phép game thủ kiếm tiền bằng cách sử dụng chính bộ máy chơi game của họ. Những người tham gia có thể bắt đầu với việc gắn nhãn dữ liệu và dần chuyển sang điều khiển robot từ xa hoặc các nhiệm vụ khác. De Witte nhấn mạnh rằng cộng đồng người dùng của Medal chính là thế hệ dễ bị ảnh hưởng nhất bởi sự dịch chuyển lao động do AI, và anh muốn họ có vai trò trong tương lai này. 🤝
Vòng Xoay Dữ Liệu và Vai Trò "Người Kích Hoạt Hệ Sinh Thái"
De Witte mong muốn General Intuition trở thành một "người kích hoạt hệ sinh thái" (ecosystem enabler) – giống như Anthropic hay OpenAI – một nhà cung cấp mô hình giúp các công ty khác xây dựng dựa trên công nghệ của mình. Hiện tại, startup này có một số khách hàng trong lĩnh vực game, mô phỏng và robot.
> "Chúng tôi sẽ không xây dựng một công ty xe tự lái," de Witte nói. "Chúng tôi sẽ giúp người tiếp theo xây dựng công ty xe tự lái dễ dàng hơn 10 lần." 🚗
Công ty cho biết một khi API của họ được nhiều khách hàng sử dụng rộng rãi, họ sẽ có thể kiểm chứng năng lực với nhiều trường hợp sử dụng đa dạng – như thử nghiệm robot trong môi trường nhà máy kỹ thuật số, cung cấp năng lượng cho bot giống người trong studio game, hoặc gửi robot bốn chân điều hướng trong môi trường nguy hiểm.
Khả năng xây dựng một "vòng xoay dữ liệu" (data flywheel) – nơi General Intuition ưu tiên chọn những khách hàng có thể cung cấp dữ liệu thế giới thực đa dạng, thú vị và hữu ích cho việc thúc đẩy nghiên cứu – chính là một trong những mục tiêu quan trọng.
Vinod Khosla khẳng định rằng dữ liệu độc quyền của General Intuition là yếu tố đưa họ đi xa đến vậy, và khả năng tiếp tục thu thập dữ liệu mà không ai khác có sẽ là yếu tố thiết yếu. Đặc biệt là, mặc dù các buổi demo rất ấn tượng, liệu việc chuyển giao từ mô phỏng sang thế giới thực có thể duy trì ở quy mô lớn hay không vẫn là một câu hỏi mở mà chưa ai trả lời được hoàn toàn. 🤔