DuckDB, một DB mã nguồn mở được sử dụng bởi Google, Facebook và Airbnb

DuckDB, DBMS được sử dụng bởi Google, Facebook và Airbnb

DuckDB là một hệ thống quản lý cơ sở dữ liệu SQL OLAP đang được

Gần đây việc phát hành phiên bản mới của DuckDB 0.5.0 đã được công bố, là một hệ thống quản lý cơ sở dữ liệu phân tích (DBMS) đang phát triển được sử dụng bởi Google, Facebook và Airbnb.

VịtDB là một hệ thống cơ sở dữ liệu phân tích hiệu suất cao. Nó được thiết kế để nhanh chóng, đáng tin cậy và dễ sử dụng. DuckDB cung cấp một phương ngữ SQL phong phú, với sự hỗ trợ vượt xa SQL cơ bản. DuckDB hỗ trợ các truy vấn con tương quan tùy ý và lồng nhau, các hàm cửa sổ, các đối chiếu, các kiểu phức tạp (mảng, cấu trúc) và hơn thế nữa.

Trong số các đặc điểm chính của nó, nổi bật sau:

  • Instalación đơn giản
  • Tích hợp: không có quản lý máy chủ
  • Định dạng lưu trữ tệp duy nhất
  • Xử lý phân tích nhanh
  • Chuyển nhanh giữa R / Python và RDBMS
  • Nó không phụ thuộc vào bất kỳ trạng thái bên ngoài nào. Ví dụ, các tệp cấu hình riêng biệt, biến môi trường.
  • Định dạng lưu trữ tệp duy nhất
  • Giao diện có thể dùng một lần. API lập trình SQL thông thạo
  • ACID đầy đủ qua MVCC

Giới thiệu về DuckDB 0.5.0

Trong số các tính năng mới là "ngoài cốt lõi", nhằm mục đích giải quyết các vấn đề có thể phát sinh khi dữ liệu đang được xử lý lớn hơn bộ nhớ bằng cách đề xuất các kết quả trung gian.

Phiên bản mới sử dụng các chỉ số Cây Radix Thích ứng (ART) để áp dụng các hạn chế và tăng tốc bộ lọc truy vấn. Cho đến nay, các chỉ mục không bền vững, dẫn đến các vấn đề như mất thông tin chỉ mục và thời gian tải lại lâu cho các bảng bị ràng buộc dữ liệu.

NGHỆ THUẬT(ART) về bản chất, nó là một nỗ lực áp dụng nén dọc và ngang để tạo ra các cấu trúc chỉ mục nhỏ gọn. Ý định là cấu trúc dữ liệu dạng cây, trong đó mỗi cấp của cây chứa thông tin về một số phần của tập dữ liệu. Chúng thường được minh họa bằng các chuỗi ký tự.

Dự án cũng bổ sung tối ưu hóa thứ tự tham gia, một vấn đề phổ biến trong cơ sở dữ liệu phân tích. Hyoun Park, Giám đốc điều hành kiêm Nhà phân tích trưởng tại Amalgam Insights, nói rằng sự khác biệt của DuckDB đến từ thực tế rằng nó là một ứng dụng nhỏ hoạt động trong quy trình công việc dựa trên mã để nhanh chóng quét các kho dữ liệu lớn.

“DuckDB thường có thể chạy các truy vấn trực tiếp trên dữ liệu mà không cần xử lý trung gian, điều này giúp cải thiện quá trình xử lý. Từ quan điểm công nghệ thuần túy, nó hơi giống với Actian Vector, cũng có cách tiếp cận truy vấn OLAP được vector hóa theo cột, mặc dù Actian được thiết kế để tìm nạp dữ liệu chứ không phải làm việc trên một quy trình hoặc tải một công việc cụ thể. »

DuckDB Labs cung cấp lời khuyên và hỗ trợ. Người đồng sáng lập và Giám đốc điều hành Hannes Mühleisen, người cũng đồng viết mã và duy trì dự án, cho biết anh lấy cảm hứng từ SQLite, công cụ cơ sở dữ liệu OLTP không máy chủ, nơi anh nhìn thấy cơ hội cho một cách tiếp cận tương tự, nhưng dành cho phân tích.

DuckDB cũng thường được sử dụng như một phần của ngăn xếp phân tích hoặc quản lý. dữ liệu lớn hơn. Ví dụ: nếu ai đó xây dựng một ứng dụng tùy chỉnh thu thập dữ liệu và sau đó muốn tạo giao diện SQL, trước tiên họ phải sao chép dữ liệu và chuyển nó sang hệ thống khác, điều này có thể gây ra sự cố đồng bộ hóa, ông giải thích.

Tải xuống và nhận

Điều quan trọng cần đề cập là trang chủ quy định rõ ràng rằng không nên sử dụng nó cho "cài đặt máy khách / máy chủ lớn để lưu trữ dữ liệu doanh nghiệp tập trung".

Dự án đang làm việc để phát hành phiên bản 1.0, sau đó sẽ không thể thực hiện thay đổi được nữa. Các công trình của các học giả thuộc Trung tâm Toán học và Khoa học Máy tính Lý thuyết Centrum Wiskunde & Informatica ở Amsterdam, DuckDB được tích hợp vào một quy trình lưu trữ, điều đáng chú ý là không có phần mềm máy chủ DBMS để cài đặt, cập nhật hoặc bảo trì.

Ví dụ: gói DuckDB Python có thể chạy các truy vấn trực tiếp trên dữ liệu từ thư viện phần mềm Python mà không cần nhập hoặc sao chép dữ liệu. DuckDB được viết bằng C ++, là mã nguồn mở miễn phí theo giấy phép của MIT.

Bạn có thể tìm hiểu thêm về nó cũng như tham khảo hướng dẫn cài đặt, Trong liên kết sau đây.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: AB Internet Networks 2008 SL
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.