Tôi là Duyệt

Mã nguồn mở Presto: truy vấn SQL dữ liệu bigdata lên đến hàng GB hay TB

Presto là tên một hệ thống dùng để truy vấn dữ liệu dạng SQL cho các mã nguồn lớn. Dữ liệu truy vấn có thể lên đến hàng Gigabyte đến Petabytes. Presto là một hệ thống mã nguồn mở được tạo ra bởi các kỹ sư của Google.

Presto được thiết kế và phát triển dành cho các hệ thống dữ liệu lớn là tốc độ cao, ví dụ như các hệ thống thương mại điện tử, các tổ chức lớn, như Facebook chẳng hạng.

Presto cho phép truy vấn từ các cơ sở dữ liệu tầm bigdata như Hive, HBase, hay các CSDL quan hệ khác. Một truy vấn có thể trả về kết quả từ nhiều nguồn khác nhau, thích hợp cho việc thống kê dữ liệu lớn toàn bộ hệ thống.

Facebook hiện đang sử dụng Presto cho hệ thống tương tác kho dữ liệu, bao gồm 300PB dữ liệu của họ. Hơn 1000 nhân viên Facebook sử dụng Presto hàng ngày để chạy hơn 30.000 truy vấn, dữ liệu trao đổi lên đến hơn 1 Petabyte mỗi ngày.

Thông tin xem tại: Trang chủ Presto | Mã nguồn Presto tại Github