DuckDB 0.9.0 "Undulata" tiba dengan peningkatan dalam storan, sokongan dan banyak lagi

DuckDB, DBMS yang digunakan oleh Google, Facebook dan Airbnb

DuckDB ialah sistem pengurusan pangkalan data SQL OLAP dalam pembuatan

Mengumumkan pelancaran versi baharu DuckDB 0.9.0 dengan nama kod “Undulata” sebagai penghormatan kepada itik paruh kuning yang berasal dari Afrika. Edisi baharu ini menyerlah kerana termasuk pencincangan Luar Teras, peningkatan prestasi agregat cincang, peningkatan prestasi dan banyak lagi.

DuckDB menggabungkan sifat SQLite seperti kekompakan, keupayaan untuk menyambung dalam bentuk perpustakaan bersepadu, penyimpanan pangkalan data dalam satu fail dan antara muka CLI yang mudah, dengan alatan dan pengoptimuman untuk melaksanakan pertanyaan analitik yang meliputi sebahagian besar data yang disimpan, contohnya , yang melakukan pengagregatan semua kandungan jadual atau menggabungkan berbilang jadual besar.

Ciri baharu utama DuckDB 0.9.0 “Undulata”

Salah satu ciri baharu utama versi baharu DuckDB 0.9.0 mungkin ialah peningkatan prestasi dengan pencincangan Out-Of-Core, sejak sekarang apabila menambah set data yang besar semasa memproses pertanyaan. Disebutkan bahawa dengan menggunakan enjin pelaksanaan penstriman dan pengurus penimbal, DuckDB menyokong banyak operasi pada set data yang melebihi memori.

Dalam versi ini, sokongan tumpahan cakera diperluaskan lagi dengan menyokong agregat cincang luar teras. Yang menyelesaikan masalah operasi yang ditamatkan kerana kekurangan ingatan dalam situasi di mana data yang digunakan untuk menambah jadual cincang tidak sesuai dengan RAM.

Satu lagi kebaharuan yang menonjol ialah sokongan untuk pemampatan rentetan dan jenis nombor integer sejurus sebelum data memasuki pengendali isihan dan pengagregatan berkumpulan yang telah mengurangkan penggunaan memori dengan ketara.

Di samping itu, kita juga boleh mencari pemuatan automatik sambungan yang dipercayai dan secara pilihan akan dipasang apabila digunakan dalam pertanyaan. Disebutkan bahawa set sambungan autoloading adalah terhad kepada sambungan rasmi yang diedarkan oleh DuckDB Labs.

Bercakap tentang sambungan, juga dalam DuckDB 0.9.0 "Undulata" a pemalam untuk AWS yang menyediakan keupayaan yang menggunakan SDK AWS. Sambungan ini mengandungi fungsi "LOAD_AWS_CREDENTIALS" yang digunakan oleh AWS untuk mendapatkan dan mengkonfigurasi bukti kelayakan secara automatik.

Juga dalam versi ini ia ditambah sokongan untuk sambungan boleh dimuatkan ke DuckDB-WASM. Sebelum ini, sebarang sambungan yang anda mahu gunakan dengan pelanggan WASM perlu disepadukan. Dengan versi ini, sambungan boleh dimuatkan secara dinamik. Apabila sambungan dimuatkan, pakej WASM dimuat turun dan kefungsian sambungan didayakan.

Daripada perubahan yang lain yang menonjol dari versi baru ini:

  • Mendayakan pembersihan automatik bagi keseluruhan kumpulan baris apabila melakukan operasi DELETE. Pilihan untuk memotong fail pangkalan data (mengurangkan saiznya) selepas memadam data juga dilaksanakan jika kumpulan baris yang dipadam berada di penghujung fail.
  • Meningkatkan kecekapan menyimpan indeks ART yang digunakan untuk mengesahkan keunikan atau kunci utama dan asing. Sebagai contoh, berbanding versi sebelumnya, saiz indeks ujian menurun daripada 278 MB kepada 78 MB.
  • Betulkan regresi dan betulkan mekanisme pemadam
  • Ralat pembahagian pembetulan semasa menambah data senarai
  • Ujian ART dan pemfaktoran semula penanda aras
  • Peningkatan had ingatan dalam ujian untuk mengelakkan kegagalan IC bukan deterministik
  • Menambah pemalam percubaan untuk membaca data daripada storan Azure. Sambungan ini membolehkan DuckDB membaca data yang disimpan secara asli dalam Azure, sama seperti cara ia boleh membaca data yang disimpan dalam S3.
  • Mengkonfigurasi Jemalloc, serta pengalokasi penimbal dan mengalih keluar salinan rentetan berlebihan dalam kamus parket
  • Pelanggan telah menambah sokongan percubaan untuk API PySpark.
  • Menambah pemalam percubaan untuk membaca jadual dalam format Apache Iceberg.
  • Julia mengemas kini kepada 0.8.1
  • Menambah conn.interrupt() pada DuckDB Python API
  • Betulkan pada parameter regresi x/y yang ditukar

akhirnya jika anda berminat untuk mengetahui lebih lanjut mengenainya, anda boleh menyemak perinciannya Dalam pautan berikut.


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab untuk data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.