Ferramenta de fala em texto do Kdenlive. Esta é a minha experiência

Ferramenta de fala para texto

Na semana passada, Pablinux falou sobre a nova versão do Kdenlive, a ferramenta de edição de vídeo do projeto KDE. Como comentei uma vez, prefiro o OpenShot, que tem uma curva de aprendizado menor, masComo eu estava muito interessado na ferramenta de fala para texto que esta nova versão incorpora, decidi dar uma olhada nela.

Embora eu tenha escrito minha cota de artigos sobre alternativas do Linux para este ou aquele programa do Windows (ninguém pode se chamar blogueiro do Linux se não escreveu um desses), esta não é uma abordagem que eu goste. Acho que os programas devem ser falados pelas suas próprias características. Se eu tiver que definir Kdenlive de alguma forma, direi que é um editor de vídeo para amadores que desejam que suas criações tenham uma aparência profissional.

Eu já disse no passado e mantenho (venha um por um) que software livre e de código aberto tem bibliotecas para trabalhos de multimídia que fazem os produtos Adobe e Blackmagic parecerem meros brinquedos. O grande problema é que ninguém se interessou em juntar essas ferramentas com uma interface simples e atrativa e uma documentação completa e de fácil compreensão. Embora o Kdenlive esteja longe de ter alcançado seu objetivo, seus desenvolvedores estão no caminho certo.

No caso da capacidade de converter voz em texto, o Kdenlive usa duas ferramentas do arsenal do repositório do Índice de pacotes Python.

Vosk é um kit de ferramentas de reconhecimento de voz offline e de código aberton Oferece modelos de reconhecimento de voz para 17 idiomas e dialetos: inglês, inglês indiano, alemão, francês, espanhol, português, chinês, russo, turco, vietnamita, italiano, holandês, catalão, árabe, grego, farsi e filipino.

Kdenlive usa modelos Vosk por meio de um módulo escrito em Python.

No entanto, ter a transcrição não é suficiente. Você também deve sincronizá-lo com o vídeo. Para isso, precisamos de outro módulo em Python para a criação de legendas.

O Kdenlive irá verificar se você tem esses módulos instalados. PPara fazer isso, você precisa primeiro instalar o pacote python3-pip em sua distribuição e, em seguida, executar os comandos:

pip3 install vosk

pip3 install srt

Em seguida, temos que instalar os modelos de voz. Para isso, abrimos o Kdenlive e vamos Configurações Configurar o Kdenlive Speech para Texto.

Para carregar os modelos você tem duas opções: ou baixe os modelos de esta página e carregá-los manualmente (Você deve primeiro marcar a caixa Pastas personalizadas do modem) ou colar o link da lista que mostra a mesma página.

Usando a ferramenta Speech to Text

  1. No menu Exibir, certifique-se de que a opção de legendas esteja ativada. Em seguida, carregue o vídeo que deseja transcrever.
  2. Mova o vídeo para a primeira trilha de vídeo e deslize a linha azul ao longo da duração que deseja transcrever.
  3. Clique na guia de legendas e depois no sinal +
  4. No topo, uma dica é adicionada. Clique no ícone à esquerda do olho.
  5. Selecione o modelo de transcrição e, se quiser transcrever um clipe, todos os clipes em uma linha do tempo ou uma parte da linha do tempo. Clique em Processo

Eu comparei o Speech com a tecnologia com a versão gratuita de uma ferramenta em nuvem e vi vídeos com legendas no Youtube e plataformas de cursos pagos. Devo dizer que não é perfeito, mas não é pior do que as alternativas mencionadas. Ele tem problemas quando quem fala não tem boa dicção ou o faz por causa da música ou de algum outro som. Mas, imaginando a pergunta que eles estão me fazendo, sim, pode ser usado para legendar uma série ou filme. Porém, devido às limitações indicadas, eles podem ter que ser preenchidos à mão.

E, se o pessoal da Kdenlive colocasse um pouco as baterias e integrassem um módulo de tradução, a coisa ficaria perfeita.

Há algo que pode ser melhorado. Hoje, se você quiser mudar a aparência das legendas, terá que inserir o código. E não há como exportá-los. Você só poderá vê-los incorporados ao vídeo.

Mas, como disse acima, sem dúvida o projeto está no caminho certo.


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: AB Internet Networks 2008 SL
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.

  1.   gabriel de luca dito

    Na caixa de edição à direita acima, você pode selecionar todo o texto, copiá-lo para a área de transferência e colá-lo onde quiser