Snap cắt giảm 76% chi phí xử lý dữ liệu nhờ chuyển sang pipeline tăng tốc bằng GPU
Bằng cách di chuyển hơn 10 petabyte dữ liệu xử lý hàng ngày sang hạ tầng GPU trên Google Cloud, Snap đã tối ưu hóa hiệu suất và tiết kiệm đáng kể chi phí vận hành.
Tag
Tổng hợp 22 bài Kalera News liên quan đến GPU — viết tiếng Việt, có dẫn nguồn gốc.
Bằng cách di chuyển hơn 10 petabyte dữ liệu xử lý hàng ngày sang hạ tầng GPU trên Google Cloud, Snap đã tối ưu hóa hiệu suất và tiết kiệm đáng kể chi phí vận hành.
Công nghệ GPU của NVIDIA đang giúp các nhà nghiên cứu giải mã nguồn gốc và hành trình giao thương của các cổ vật gốm sứ có lịch sử hàng nghìn năm.
Phiên bản llama.cpp b9235 giới thiệu tính năng Speculative N-gram Tuning, giúp tối ưu tốc độ giải mã (decode) đáng kể khi chạy các model lớn như Qwen3.6 27B.
NVIDIA vừa đăng tải thông điệp ngắn đầy phấn khích trên X, kêu gọi cộng đồng cùng đón chờ những khoảnh khắc quan trọng trong bài phát biểu (keynote) sắp diễn ra.
Nền tảng Vera Rubin mới của NVIDIA kết hợp NVL72 và Groq 3 LPX cho phép chạy các workload agentic trên mô hình MoE khổng lồ mà không phải hy sinh độ trễ.
CEO Hugging Face tin rằng AI chạy trên hạ tầng nội bộ (local/on-prem) dựa trên mã nguồn mở sẽ là lời giải cho tình trạng thiếu hụt GPU và chi phí API đắt đỏ.
Việc tối ưu hóa quá trình inference cho các mô hình Transformer lớn là chìa khóa để giảm chi phí bộ nhớ và thời gian vận hành trong thực tế.
Một tiện ích dòng lệnh mới hỗ trợ nhà phát triển dễ dàng chia sẻ các tệp vết (traces) cấu hình GPU thông qua Hugging Face, giúp tối ưu hóa việc phân tích hiệu năng mô hình.
TokenSpeed là engine inference LLM mới với hiệu suất ngang ngửa TensorRT-LLM nhưng dễ sử dụng như vLLM, được phát hành dưới giấy phép MIT.
Nvidia vừa đăng tải một câu hỏi ngắn đầy ẩn ý trên mạng xã hội X, kích thích sự tò mò của cộng đồng công nghệ về những công bố sắp tới của hãng.
Hugging Face nhấn mạnh rằng giá trị thực sự của việc chạy AI cục bộ nằm ở những kỹ năng kỹ thuật thực tế mà người dùng tích lũy được, vượt xa chi phí phần cứng đầu tư.
Học bổng Graduate Fellowship của NVIDIA bước sang năm thứ 25, hỗ trợ tài chính và kỹ thuật cho các nghiên cứu sinh tiến sĩ xuất sắc trong lĩnh vực tính toán tăng tốc.
Công nghệ học sâu chạy trên GPU của NVIDIA đã giúp các nhà nghiên cứu giải mã dữ liệu nhiều năm từ tàu Cassini chỉ trong vài giây để vẽ bản đồ mây metan trên Titan.
Các nghiên cứu mới tại Ba Lan ứng dụng học sâu và GPU NVIDIA để tối ưu hóa dự báo độ ẩm, giúp nâng cao độ chính xác khi cảnh báo bão lũ.
Hugging Face công bố dữ liệu từ 300.000 người dùng về cấu hình phần cứng chạy AI, cho thấy xu hướng bùng nổ của AI chạy cục bộ (local AI).
CEO NVIDIA Jensen Huang vừa hạ cánh xuống Đài Bắc để chuẩn bị cho sự kiện GTC trong khuôn khổ COMPUTEX 2026. Đây là thời điểm quan trọng cho các công bố mới về hạ tầng AI và GPU.
NVIDIA vừa xác nhận sẽ tham gia một sự kiện sắp tới tại Los Angeles qua một thông báo ngắn trên X. Động thái này gợi mở về những công bố chiến lược quan trọng của 'gã khổng lồ' chip.
Đại diện NVIDIA nhấn mạnh tầm quan trọng của hiệu năng phần cứng đối với các startup AI. Các coding agent thế hệ mới chỉ có thể tồn tại nhờ sức mạnh từ các dòng chip tiên tiến nhất hiện nay.
NVIDIA xác nhận Jensen Huang sẽ có bài diễn thuyết quan trọng tại Đài Bắc trong khuôn khổ COMPUTEX 2026, hứa hẹn công bố các bước tiến mới nhất về AI và điện toán tăng tốc.
Hugging Face ra mắt chuyên trang Hardware, cung cấp cái nhìn thực tế về các loại GPU, CPU và phân bổ VRAM đang thực sự vận hành hệ sinh thái AI mã nguồn mở.
Nghiên cứu mới từ Hugging Face cho thấy NVIDIA RTX 3060 vẫn là mẫu GPU phổ biến nhất trong cộng đồng người dùng mã nguồn mở, mang lại thông tin quan trọng cho các nhà phát triển phần mềm.
OpenAI giới thiệu dịch vụ Guaranteed Capacity, cho phép doanh nghiệp đăng ký trước tài nguyên tính toán để đảm bảo khả năng mở rộng AI ổn định và dài hạn.