Red Hat travaille déjà sur un nouveau système de fichiers NVFS, efficace pour NVM

Logo du chapeau rouge

Mikuláš Patocka, l'un des développeurs LVM et inventeur de plusieurs inventions d'optimisation du stockage chez Red Hat, a introduit le nouveau système de fichiers NVFS dans la liste de diffusion du noyau Linux.

Ce nouveau système vise à créer un système de fichiers rapide et compact pour les puces de mémoire non volatile (NVM, par exemple NVDIMM), qui combine les performances de la RAM avec la possibilité de stocker du contenu en permanence.

Lors du développement de NVFS l'expérience de FS NOVA a été prise en compte, en 2017 créé spécifiquement pour la mémoire NVM, mais non inclus dans le noyau Linux et avec un support limité pour les noyaux Linux de 4.13 à 5.1.

Le FS NVFS proposé c'est beaucoup plus simple que NOVA (4972 lignes de code vs 21459), fournit un utilitaire fsck, a de meilleures performances, prend en charge les attributs étendus (xattrs), les étiquettes de sécurité, les ACL et les quotas, mais ne prend pas en charge les instantanés.

L'architecture NVFS est proche de FS Ext4 et il s'intègre bien dans le modèle de système de fichiers basé sur le sous-système VFS, ce qui permet de minimiser le nombre de couches intermédiaires et de se débrouiller avec un module qui ne nécessite pas de correctifs du noyau.

NVFS utilise l'interface du noyau DAX pour accéder directement aux périphériques stockage persistant, en contournant le cache de page. Pour optimiser le travail avec la mémoire NVM, qui utilise l'adressage d'octets, le contenu du lecteur est mappé à l'espace d'adressage linéaire du noyau sans utiliser la couche de périphérique bloc traditionnelle et le cache intermédiaire. Il est utilisé pour stocker le contenu des répertoires de l'arborescence racine (arbre racine), dans lequel chaque nom de fichier proheshirovano et chaque valeur de hachage sont utilisés pour rechercher l'arborescence.

L'intégrité des données est assurée par le mécanisme de «mises à jour» (comme dans FreeBSD UFS et OpenBSD FFS) sans utiliser le journal.

Pour éviter la corruption de fichiers dans NVFS, lLes opérations d'échange de données sont regroupées de sorte qu'un crash ne peut pas conduire à la perte de blocs ou d'inodes, et l'intégrité des structures est restaurée par l'utilitaire fsck.

L'utilitaire fsck est multithread et offre une performance de force brute de 1,6 million d'inodes par seconde.

  • Dans les tests de performance, NVFS a effectué une opération de copie d'arborescence avec les sources du noyau Linux dans la mémoire NVM environ 10% plus rapide que NOVA, 30% plus rapide que ext4 et 37% plus rapide que XFS.
  • Dans le test de recherche de données, NVFS était plus rapide que NOVA de 3% et ext4 et XFS de 15% (mais avec un cache disque actif, NOVA était 15% plus lent).
  • Dans le test Million Directory Operations, NVFS a surpassé NOVA de 40%, ext4 de 22% et XFS de 46%. Lors de la simulation de l'activité du SGBD, le système de fichiers NVFS a surpassé NOVA de 20%, ext4 de 18 fois et XFS de 5 fois. Dans le test fs_mark, NVFS et NOVA étaient à peu près les mêmes, tandis que ext4 et XFS étaient environ 3 fois en retard.

Le décalage des FS traditionnels dans la mémoire NVM est dû au fait qu'ils ne sont pas conçus pour l'adressage d'octets utilisé dans la mémoire non volatile, qui ressemble à la RAM normale.

La lecture de lecteurs ordinaires fournit une atomicité de fonctionnement au niveau de lecture / écriture de secteur, tandis que la mémoire NVM fournit un accès au niveau de mots machine individuels.

En outre, les systèmes de fichiers traditionnels essaient de réduire l'intensité de l'accès aux médias, qui est évidemment considéré comme plus lent que la RAM, et essaient également de regrouper les opérations pour assurer des lectures séquentielles lors de l'utilisation de disques durs, de traiter les files d'attente de demandes, de lutter contre la fragmentation et de séparer les priorités pour effectuer différentes opérations. .

Pour la mémoire NVM, de telles complications ne sont pas nécessaires, car la vitesse d'accès aux données est comparable à celle de la RAM.

source: https://lkml.org/lkml/2020/9/15/517


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données : AB Internet Networks 2008 SL
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.