Outil Speech-to-Text de Kdenlive. C'est mon expérience

Outil de parole en texte

La semaine dernière, Pablinux vous a parlé de la nouvelle version de Kdenlive, l'outil de montage vidéo du projet KDE. Comme je l'ai déjà dit, je préfère OpenShot qui a une courbe d'apprentissage plus faible, maisComme j'étais très intéressé par l'outil de synthèse vocale que cette nouvelle version intègre, j'ai décidé de l'examiner.

Bien que j'aie écrit ma part d'articles sur les alternatives Linux à tel ou tel programme Windows (personne ne peut se qualifier de blogueur Linux s'il n'en a pas écrit un), ce n'est pas une approche que j'aime. Je pense que les programmes devraient être décrits en fonction de leurs propres caractéristiques. Si je dois définir Kdenlive de quelque manière que ce soit, je dirai que c'est un éditeur vidéo pour les amateurs qui veulent que leurs créations aient un aspect professionnel.

J'ai dit dans le passé et je le garde (viens un par un) que les logiciels libres et open source ont des bibliothèques pour le travail multimédia qui font que les produits Adobe et Blackmagic ressemblent à de simples jouets. Le gros problème est que personne n'était intéressé à mettre ces outils en commun avec une interface simple et attrayante et une documentation complète et facile à comprendre. Bien que Kdenlive soit loin d'avoir atteint son objectif, ses développeurs sont sur la bonne voie.

Dans le cas de la possibilité de convertir la parole en texte, Kdenlive utilise deux outils de l'arsenal du référentiel du Index des packages Python.

Vosk est une boîte à outils de reconnaissance vocale open source et hors lignen. Il propose des modèles de reconnaissance vocale pour 17 langues et dialectes: anglais, anglais indien, allemand, français, espagnol, portugais, chinois, russe, turc, vietnamien, italien, néerlandais, catalan, arabe, grec, farsi et philippin.

Kdenlive utilise les modèles Vosk via un module écrit en Python.

Cependant, avoir la transcription ne suffit pas. Vous devez également le synchroniser avec la vidéo. Pour cela, nous avons besoin d'un autre module en Python pour créer des sous-titres.

Kdenlive vérifiera que ces modules sont installés. PPour ce faire, vous devez d'abord installer le package python3-pip sur votre distribution, puis exécuter les commandes:

pip3 install vosk

pip3 install srt

Ensuite, nous devons installer les modèles vocaux. Pour cela, nous ouvrons Kdenlive et nous allons Paramètres Configurez Kdenlive Speech to Text.

Pour charger les modèles, vous avez deux options: ou téléchargez les modèles depuis cette page et chargez-les manuellement (Vous devez d'abord cocher la case Dossiers de modem personnalisés) ou coller le lien de la liste qui vous montre cette même page.

Utilisation de l'outil Speech to Text

  1. Assurez-vous dans le menu Affichage que l'option sous-titres est activée. Ensuite, téléchargez la vidéo que vous souhaitez transcrire.
  2. Déplacez la vidéo sur la première piste vidéo et faites glisser la ligne bleue sur la longueur que vous souhaitez transcrire.
  3. Cliquez sur l'onglet sous-titres puis sur le signe +
  4. Un indice est ajouté en haut. Cliquez sur l'icône à gauche de l'œil.
  5. Sélectionnez le modèle de transcription et si vous souhaitez transcrire un clip, tous les clips d'une chronologie ou une partie de la chronologie. Cliquez sur Process

J'ai comparé Speech to tech à la version gratuite d'un outil cloud et j'ai vu des vidéos auto-sous-titrées de Youtube et de plateformes de cours payantes. Je dois dire que ce n'est pas parfait, mais ce n'est pas pire que les alternatives mentionnées. Il a des problèmes lorsque ceux qui parlent n'ont pas une bonne diction ou le font par rapport à la musique ou à un autre son. Mais, en imaginant la question qu'ils me posent, oui, cela peut être utilisé pour sous-titrer une série ou un film. Cependant, en raison des limites indiquées, ils peuvent devoir être remplis à la main.

Et, si les gars de Kdenlive mettaient un peu les batteries et intégraient un module de traduction, ce serait parfait.

Il y a quelque chose qui pourrait être amélioré. Aujourd'hui, si vous souhaitez modifier l'apparence des sous-titres, vous devrez insérer du code. Et il n'y a aucun moyen de les exporter. Vous ne pourrez les voir que intégrés à la vidéo.

Mais, comme je l'ai dit plus haut, sans aucun doute, le projet est sur la bonne voie.


Le contenu de l'article adhère à nos principes de éthique éditoriale. Pour signaler une erreur, cliquez sur c'est par ici !.

Soyez le premier à commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données: Miguel Ángel Gatón
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.