
Hace un tiempo, poco despuĂ©s de publicar una guĂa sobre Markdown, busquĂ© informaciĂ³n para saber si se podĂa usar LibreOffice para crear ese tipo de documentos. No encontrĂ© nada, a no ser que respuestas del tipo «¿para quĂ© quieres hacer eso?» cuenten. La idea era crear un documento con un editor tipo Word o Writer y luego salvarlo en formato .md, pero lo dicho; no encontrĂ© nada. Recientemente, Microsoft ha lanzado una herramienta para algo parecido, y su nombre es MarkItDown.
MarkItDown es una librerĂa de Python que se puede instalar en el sistema — no en Linux desde Python 3.12 — o en un entorno virtual (env). Tras su instalaciĂ³n, el uso base o en crudo requerirĂa escribir unas lĂneas en Python, las que tenĂ©is aquĂ debajo. Pero no es la Ăºnica manera de usarlo.
MarkItDown haciendo uso de Python
La API es asĂ de simple:
from markitdown import MarkItDown
markitdown = MarkItDown()
result = markitdown.convert("test.xlsx")
print(result.text_content)
De lo anterior, la primera lĂnea importa la librerĂa; la segunda crea un objeto compatible; en la tercera realiza la conversiĂ³n — a un archivo que en el ejemplo han llamado text.xlsx — y en la cuarta imprimirĂa el resultado en consola. AdemĂ¡s, como se explica en su GitHub, se puede hacer compatible con LLM como ChatGPT, todo esto ya a gusto del consumidor y dependiendo de los conocimientos de cada uno.
Si el cĂ³digo no es lo mejor para nosotros, un desarrollador de nombre Matt Palmer ha creado una web para facilitar la tarea. Aunque estĂ¡ en inglĂ©s, su uso es muy sencillo. En la parte inferior del cuadro pone los archivos soportados, que son PDF, PPTX, DOCX, XLSX, ImĂ¡genes, Audio, HTML y archivos de texto. Lo Ăºnico que tendremos que hacer es arrastrar un archivo al cuadro y esperar a que suceda la magia, como se ve en la captura de cabecera.
En el momento de escribir este artĂculo hay un problema al descargar el archivo, que muestra un mensaje de error en vez del texto. Es posible, algo que no he comprobado, que yo lo estĂ© viendo porque he creado el archivo desde Linux, LibreOffice o ambos, pero yo veo ese error al descargar el archivo. La conversiĂ³n la hace bien, y siempre se puede copiar el texto plano que genera, pegarlo en un archivo de texto y guardarlo con extensiĂ³n .md.
Para visualizarlo, en Linux podemos usar herramientas como Okular, Visual Studio Code o algĂºn programa de esta lista, entre otros.
A tener en cuenta
Aunque la herramienta la ha creado Microsoft, no todo saldrĂ¡ siempre bien. Para que obtener los mejores resultados, hay que hacer uso de las opciones correctas. Por ejemplo, para que ponga un # Titular o ## TĂtulo 2, hay que seleccionar eso en las opciones de Word o Writer. Lo mismo con las listas ordenadas o desordenadas, enlaces, imĂ¡genes… Si en vez de usar las opciones correctas, seleccionamos un texto y le ponemos una fuente en negrita y mĂ¡s grande, Markdown no trabaja asĂ, y es posible que obtengamos resultados mixtos. Para mĂ¡s informaciĂ³n sobre las marcas soportadas, os remitimos al enlace que encontrarĂ©is en el primer pĂ¡rrafo de esta nota.
Ahora bien, es una herramienta oficial de Microsoft, y puede ser la mejor opciĂ³n para pasar los archivos soportados a Markdown.