DuckDB 0.6.0 kini telah dikeluarkan dan termasuk penambahbaikan pada penulisan cakera, pemuatan data dan banyak lagi.

DuckDB, DBMS yang digunakan oleh Google, Facebook dan Airbnb

DuckDB ialah sistem pengurusan pangkalan data SQL OLAP dalam pembuatan

Pengeluaran versi baharu DBMS telah diumumkan DuckDB 0.6.0, versi di mana pemampatan data telah dipertingkatkan, sebagai tambahan kepada fakta bahawa fungsi baharu telah ditambah, serta penambahbaikan storan, antara lain.

DuckDB menggabungkan sifat SQLite seperti kekompakan, keupayaan untuk menyambung dalam bentuk perpustakaan bersepadu, penyimpanan pangkalan data dalam satu fail dan antara muka CLI yang mudah, dengan alatan dan pengoptimuman untuk melaksanakan pertanyaan analitik yang meliputi sebahagian besar data yang disimpan, contohnya , yang melakukan pengagregatan semua kandungan jadual atau menggabungkan berbilang jadual besar.

Ciri baharu utama DuckDB 0.6.0

Dalam versi baru yang dibentangkan ini, ia diserlahkan kerja diteruskan untuk menambah baik format storan, selain itu mod tulis cakera telah dilaksanakan, di mana apabila set data yang besar dimuatkan dalam satu transaksi, data tersebut dimampatkan dan distrim ke fail daripada pangkalan data tanpa menunggu arahan COMMIT untuk melakukan transaksi.

Satu lagi perubahan yang menonjol dalam versi baharu ialah menambah sokongan untuk memuatkan data selari ke dalam jadual berasingan, yang boleh meningkatkan kelajuan pemuatan dengan ketara pada sistem berbilang teras. Sebagai contoh, dalam versi lama, memuatkan pangkalan data dengan 150 juta baris pada CPU 10 teras mengambil masa 91 saat, dan dalam versi baharu, operasi ini mengambil masa 17 saat. Terdapat dua mod pemuatan selari: dengan pemeliharaan pesanan rekod dan tanpa pemeliharaan pesanan.

Untuk pemampatan data, algoritma FSST digunakan (Jadual Pantas Simbol Statik), yang membolehkan anda membungkus data dalam baris menggunakan kamus biasa jenis padanan. Aplikasi algoritma baharu dibenarkan untuk mengurangkan saiz pangkalan data ujian daripada 761 MB kepada 251 MB.

Untuk memampatkan nombor (DOUBLE dan FLOAT) algoritma Chimp dan Patas dicadangkan. Berbanding dengan algoritma Gorillas sebelumnya, Chimp menyediakan tahap pemampatan yang lebih tinggi dan penyahmampatan yang lebih cepat. Algoritma Patas ketinggalan di belakang Chimp dari segi pemampatan, tetapi jauh lebih pantas dalam kelajuan penyahmampatan, yang hampir sama seperti membaca data tidak dimampatkan.

Ia juga menonjolkan bahawa ia telah ditambahkan keupayaan percubaan untuk memuatkan data daripada fail CSV dalam berbilang aliran selari (SET experimental_parallel_csv=true), yang mengurangkan masa muat untuk fail CSV yang besar dengan ketara. Sebagai contoh, apabila pilihan didayakan, masa muat turun untuk fail CSV 720MB telah dikurangkan daripada 3,5 saat kepada 0,6 saat.

Daripada perubahan yang lain yang menonjol dari versi baru ini:

  • Kemungkinan pelaksanaan selari penciptaan indeks dan operasi pengurusan telah dilaksanakan.
  • SQL menyediakan keupayaan untuk membentuk pertanyaan yang bermula dengan perkataan "FROM" dan bukannya "SELECT". Dalam kes ini, pertanyaan diandaikan bermula dengan "PILIH *".
  • Menambah sokongan untuk ungkapan "COLUMNS" dalam SQL, membolehkan anda melakukan operasi pada berbilang lajur tanpa menduplikasi ungkapan.
  • Penggunaan memori yang dioptimumkan. Secara lalai pada platform Linux, perpustakaan jemalloc digunakan untuk pengurusan memori. Prestasi operasi cantum cincang yang dipertingkatkan dengan ketara apabila ingatan terhad.
  • Menambahkan mod output ".mode duckbox" pada CLI, membuang lajur tengah berdasarkan lebar garisan tetingkap terminal). Dengan parameter ".maxrows X", anda juga boleh mengehadkan bilangan baris output.
  • CLI menyediakan autolengkap input sedar konteks (kata kunci, nama jadual, fungsi, nama lajur dan input nama fail selesai).
  • CLI didayakan secara lalai untuk memaparkan penunjuk kemajuan pertanyaan.

akhirnya jika anda berminat untuk mengetahui lebih lanjut mengenainya, anda boleh menyemak perinciannya Dalam pautan berikut.


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab untuk data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.