Bỏ qua đến nội dung chính
Về trang chủ
Tech AI 6 phút đọc

Vệ Tinh Tự Học Cách "Nhìn" và "Hiểu" Mục Tiêu Trên Quỹ Đạo: Khởi Đầu Kỷ Nguyên AI Vũ Trụ Mới? 🛰️🧠

Lần đầu tiên, một vệ tinh quan sát Trái Đất đã tự động xác định được các mục tiêu quan tâm trên quỹ đạo nhờ mô hình thị giác-ngôn ngữ (VLM) tích hợp, mở ra tiềm năng cách mạng hóa cách chúng ta thu thập và xử lý dữ liệu không gian.

Tier 1 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc techcrunch.com

Vệ Tinh Tự Học Cách "Nhìn" và "Hiểu" Mục Tiêu Trên Quỹ Đạo: Khởi Đầu Kỷ Nguyên AI Vũ Trụ Mới? 🛰️🧠

Vượt Ngưỡng: Vệ Tinh Tự Động Phát Hiện Mục Tiêu Không Cần Can Thiệp Con Người 🚀

Tháng 4 vừa qua đã đánh dấu một cột mốc lịch sử: một vệ tinh quan sát Trái Đất đã tự tìm thấy thứ mình cần, hoàn toàn không cần đến các chuyên gia phân tích trên mặt đất. Đây là lần đầu tiên mô hình thị giác-ngôn ngữ (VLM) được báo cáo ứng dụng trên quỹ đạo, hé lộ cách AI có thể thay đổi cơ bản khả năng của các cảm biến không gian và giá trị mà chúng mang lại.

Thông thường, các vệ tinh sẽ tải xuống lượng lớn dữ liệu thô cho các nhà phân tích dưới Trái Đất, những người sau đó sử dụng thuật toán học máy hoặc chính mắt mình để hiểu những gì đang diễn ra. Tuy nhiên, trên Yam-9, một tàu vũ trụ do công ty cơ sở hạ tầng không gian Loft Orbital chế tạo, một gói phần mềm do Phòng Thí nghiệm Sức đẩy Phản lực (JPL) của NASA phát triển đã tự động xác định các khu vực đáng quan tâm chỉ bằng các truy vấn ngôn ngữ tự nhiên.

"Trái Tim" AI Của Yam-9: Google DeepMind's Gemma 3 💪

Mô hình thị giác-ngôn ngữ (VLM) Gemma 3 của Google DeepMind, được xây dựng đặc biệt cho các ứng dụng biên (edge applications), có nghĩa là nó được thiết kế để chạy trên phần cứng hạn chế, cách xa trung tâm dữ liệu.

VLMs kết hợp khả năng hiểu ngữ cảnh của các mô hình ngôn ngữ lớn (LLM) với khả năng phân tích hình ảnh. Các nhà nghiên cứu đã yêu cầu mô hình phân loại dữ liệu cảm biến tại nơi môi trường tự nhiên giao thoa với sự phát triển của con người, hoặc xác định cơ sở hạ tầng xung quanh các trung tâm đường sắt – và nó đã thực hiện được.

Ý Nghĩa Đột Phá: Từ Tối Ưu Dữ Liệu Đến "Tuần Tra" Vũ Trụ 🌟

* Trong ngắn hạn: Công nghệ này có thể làm cho các cảm biến không gian trở nên hữu ích hơn nhiều bằng cách thực hiện sàng lọc dữ liệu ban đầu ngay trên quỹ đạo, giảm bớt lượng dữ liệu thô khổng lồ mà các nhà phân tích hiện phải xử lý. * Trong dài hạn: Đây là một bằng chứng cho việc xây dựng cơ sở hạ tầng AI quy mô lớn hơn trong không gian.

Paul Lasserre, người đứng đầu bộ phận AI của Loft, chia sẻ với TechCrunch: > "Nó mở ra cánh cửa cho các lớp tuần tra 'luôn bật' trong không gian. Nếu bạn có một VLM, bạn có thể thiết lập logic – như 'giám sát biên giới này cho tôi, và cho tôi biết khi nào có điều gì đáng ngờ', và tương tác qua lại với các vệ tinh."

Công Nghệ Đằng Sau Cánh Cửa Vũ Trụ ⚙️

Các tàu vũ trụ của Loft được thiết kế như nền tảng cho khách hàng bên thứ ba, với mô hình kinh doanh gần giống "cơ sở hạ tầng dưới dạng dịch vụ". Yam-9 được phóng vào mùa thu năm 2025, là "tiền trạm" cho các dự án AI trên quỹ đạo của công ty, và được trang bị GPU Nvidia Jetson Orrin AGX – một trong những chip hàng đầu được sử dụng trong tính toán không gian.

Juan Delfa Victoria, một lãnh đạo kỹ thuật trong nhóm AI của NASA JPL, đã dẫn đầu việc phát triển NAVI-Orbital – gói phần mềm "ghép nối" cho VLM Gemma 3. Mặc dù Gemma 3 là sản phẩm có sẵn, các kỹ sư phần mềm đã phải tối ưu hóa gói phần mềm để giảm yêu cầu về thư viện và bộ nhớ.

Tương Lai Không Xa: Một Chòm Sao Vệ Tinh AI 🌌

Đây chỉ là lần đầu tiên VLM được báo cáo sử dụng trên quỹ đạo, nhưng dự kiến các công ty khác sẽ sớm noi theo. Planet Labs, vốn đã sử dụng bộ xử lý Jetson Orin trên vệ tinh của mình, đang nghiên cứu các ứng dụng AI khác, bao gồm VLM. Kepler Communications, công ty vận hành cụm GPU lớn nhất trong không gian, cũng ám chỉ về các trường hợp sử dụng VLM không được tiết lộ.

Ông Lasserre khẳng định: > "Giờ đây chúng tôi đã chứng minh được khái niệm này, đó chính là định hướng phát triển. Mục tiêu là xây dựng một chòm sao để đảm bảo phủ sóng theo thời gian thực ở bất cứ đâu trên Trái Đất, điều mà ông nói sẽ cần khoảng 50 đến 100 vệ tinh như Yam-9."

Những bài học kinh nghiệm từ việc triển khai các mô hình nhỏ hơn này sẽ định hình cách các công ty cố gắng triển khai cơ sở hạ tầng tính toán quy mô lớn hơn trong không gian, đặc biệt là trong các lĩnh vực quan trọng nhưng ít được chú ý như quản lý điện năng và bộ nhớ.

Trợ Lý Kỹ Thuật Số Cho Phi Hành Gia? 🧑‍🚀

Ý tưởng cho NAVI-Space ban đầu đến từ nhà nghiên cứu JPL Taran Cyriac John, người đã hình dung về các trợ lý kỹ thuật số cho các phi hành gia khám phá Mặt Trăng hoặc Sao Hỏa.

Delfa Victoria giải thích: > "Chúng tôi nghĩ rằng, phi hành gia mặc bộ đồ áp suất, họ không thể gõ bàn phím, bất cứ điều gì họ muốn làm đều phức tạp. Vậy thì, tại sao chúng ta không cung cấp một trợ lý, giống như trong trò chơi điện tử và phim ảnh, nơi bạn thấy một AI có tính tương tác?"

Chỉ cần đừng gọi nó là HAL 9000 nhé! 😉