Bỏ qua đến nội dung chính
Về trang chủ
tools-ai Tech 6 phút đọc

SỐC! 🤯 ClickHouse Ra Mắt PostgresBench: Công Cụ Benchmark OLTP Mở Vạch Trần Sự Thật Về Hiệu Năng PostgreSQL Quản Lý! 🚀

ClickHouse vừa ra mắt PostgresBench, bộ công cụ benchmark OLTP mã nguồn mở cho PostgreSQL quản lý, cho thấy dịch vụ Postgres của họ vượt trội đáng kể về thông lượng và độ trễ so với các đối thủ lớn như AWS RDS/Aurora nhờ kiến trúc lưu trữ NVMe cục bộ.

Tier 1 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc clickhouse.com

Kalera News xin giới thiệu: ClickHouse, nhà phát triển cơ sở dữ liệu phân tích hàng đầu, vừa chính thức trình làng PostgresBench – một bộ công cụ benchmark công khai, minh bạch và có thể tái hiện hoàn toàn, được thiết kế để đánh giá hiệu năng của các dịch vụ PostgreSQL được quản lý. Lấy cảm hứng từ benchmark phân tích OLAP nổi tiếng ClickBench, PostgresBench áp dụng cùng phương pháp luận mã nguồn mở nghiêm ngặt vào các tác vụ giao dịch (OLTP) của Postgres. Các nền tảng được thử nghiệm ban đầu bao gồm Postgres do ClickHouse quản lý, AWS RDS for PostgreSQL, AWS Aurora PostgreSQL, NeonCrunchy Bridge. Đáng chú ý, kết quả ban đầu đã hé lộ sự chênh lệch hiệu năng cực lớn, với Postgres do ClickHouse quản lý đang thống trị cả về thông lượng và độ trễ ở nhiều quy mô khác nhau. 🚀

Thiết Kế & Phương Pháp Benchmark 🛠️

PostgresBench sử dụng pgbench tiêu chuẩn (công cụ benchmark chính thức của PostgreSQL) chạy một tác vụ giao dịch giống TPC-B. Tác vụ này bao gồm các giao dịch cơ sở dữ liệu ngắn, có tính đồng thời cao với các thao tác ghi, cập nhật và đọc thường xuyên, mô phỏng hoàn hảo các ứng dụng xử lý giao dịch trực tuyến (OLTP) thực tế, đang phát triển nhanh chóng.

Các Thông Số Kiểm Tra Chính:

* Công cụ: pgbench sử dụng các giao dịch đã chuẩn bị (-M prepared). * Đồng thời: 256 client chạy trên 16 thread (-c 256 -j 16). * Thời lượng chạy ổn định: 10 phút (600 giây) mỗi lần chạy để đảm bảo số liệu phản ánh hiệu suất trạng thái ổn định, không phải các đợt tăng đột biến tạm thời. Mỗi dịch vụ được chạy 3 lần liên tiếp, và thứ hạng thể hiện cả trạng thái tốt nhất và tệ nhất. * Hệ số Tỷ lệ Được Kiểm Tra: * Hệ số 6849 (~100 GB): Đại diện cho một cơ sở dữ liệu đang phát triển nhanh, phù hợp với RAM/cache. * Hệ số 34247 (~500 GB): Đại diện cho một tập dữ liệu trưởng thành, lớn hơn RAM và phải đổ ra đĩa. * Vị trí Client: Một instance 16 vCPU, 64 GB được triển khai tại cùng khu vực đám mây (us-east-2) với các cơ sở dữ liệu mục tiêu để loại bỏ độ trễ mạng giữa các vùng. * Cấu hình Mặc định: Không áp dụng bất kỳ tinh chỉnh hiệu suất tùy chỉnh, dành riêng cho nhà cung cấp nào. Các cấu hình mặc định, nguyên bản được kiểm tra cho tất cả các nhà cung cấp để phản ánh trải nghiệm người dùng điển hình.

Kết Quả Benchmark Nổi Bật 📊

1. Hệ Số Tỷ Lệ 6849 (Cơ Sở Dữ Liệu ~100 GB)

Ở quy mô 100 GB, sự khác biệt về hiệu suất là rất đáng kinh ngạc. Ở phân khúc Instance Nhỏ (4 vCPU / 16 GB), Postgres do ClickHouse quản lý và Crunchy Bridge dẫn đầu. Ở phân khúc Instance Lớn (16 vCPU / 64 GB), dịch vụ Postgres được quản lý của ClickHouse thống trị, mang lại hơn 28.600 TPS — gần gấp đôi thông lượng của AWS Aurora và hơn ba lần thông lượng của AWS RDS và Neon.

Cụ thể, Postgres do ClickHouse quản lý trên instance lớn (16 vCPUs) đạt 28.668 giao dịch/giây (TPS) với độ trễ trung bình chỉ 8.908 ms. Trong khi đó, AWS Aurora cùng cấu hình chỉ đạt 12.628 TPS, và AWS RDS chỉ là 8.133 TPS.

2. Hệ Số Tỷ Lệ 34247 (Cơ Sở Dữ Liệu ~500 GB - Đổ Dữ Liệu Ra Đĩa)

Thử nghiệm thực tế quan trọng nhất diễn ra khi kích thước cơ sở dữ liệu vượt quá bộ nhớ khả dụng và phải đổ ra đĩa. Ở mức 500 GB trên Instance Lớn, Postgres do ClickHouse quản lý duy trì hiệu suất ghi cực kỳ cao, đạt 26.328 TPS với độ trễ trung bình chỉ 9.7 ms. Con số này nhanh hơn 2.5 lần so với AWS Aurora (10.402 TPS) và hơn 5 lần so với AWS RDS (5.092 TPS). Điều này chứng minh khả năng xử lý vượt trội khi tải nặng và dữ liệu lớn. 🔥

Giải Mã Kiến Trúc: Tại Sao Postgres Của ClickHouse Lại Nhanh Đến Vậy? 💡

Kết quả hiệu năng ấn tượng này làm nổi bật sự khác biệt rõ rệt trong kiến trúc lưu trữ cơ sở dữ liệu:

1. Điện toán & Lưu trữ NVMe Đặt Cùng Vị Trí: Postgres do ClickHouse quản lý sử dụng các instance với ổ cứng SSD NVMe vật lý hiệu suất cao được gắn trực tiếp vào máy ảo (sử dụng phần cứng tối ưu cho lưu trữ m8gd Graviton hiện đại của AWS). Điều này giúp giảm thiểu các bước nhảy mạng I/O đĩa. 2. Nút Thắt Cổ Chai Mạng của Đĩa Chia Sẻ: Ngược lại, các kiến trúc như AWS Aurora tách biệt điện toán và lưu trữ qua một mạng lưới, và các instance AWS RDS tiêu chuẩn dựa vào các ổ đĩa GP3/GP4 Elastic Block Storage (EBS) qua kết nối mạng. Dưới điều kiện ghi liên tục, nặng nề (tạo WAL), độ trễ mạng này trở thành một nút thắt cổ chai nghiêm trọng. 3. Hiệu Quả Ghi Nhật Ký Trước (WAL): Trong các môi trường giao dịch có thông lượng cao, hiệu suất ghi đĩa tuần tự là nút thắt cổ chai cuối cùng. Việc lưu trữ NVMe cục bộ vật lý loại bỏ thời gian chuyển tiếp cần thiết để nhân bản các trang WAL qua mạng, đó là lý do mô hình của ClickHouse duy trì lợi thế dẫn đầu rất lớn.

Hoàn Toàn Minh Bạch và Có Thể Kiểm Toán 🌐

Để tránh bẫy 'benchmark thiên vị nhà cung cấp' điển hình, ClickHouse đã phát hành PostgresBench dưới dạng một dự án mã nguồn mở hoàn chỉnh theo giấy phép Apache 2.0. Kho lưu trữ chứa các tệp Terraform, tập lệnh triển khai và các lệnh pgbench chính xác được sử dụng để biên soạn các số liệu thống kê này.

Cộng đồng được khuyến khích tích cực tái hiện, kiểm toán, thêm các thông số tùy chỉnh hoặc đăng ký các dịch vụ PostgreSQL quản lý mới vào bảng xếp hạng.

* Kho lưu trữ GitHub: ClickHouse/PostgresBench * Bảng xếp hạng Trực tuyến Tương tác: postgresbench.clickhouse.com

Đã đọc hết tin tools-ai hiện có.