Nepomuk, el escritorio semántico de KDE

No les voy a mentir: lo que realmente me interesó de Nepomuk, aún antes de saber lo que era, fue su loguito (ya saben, colores pasteles, rosa y plateado: cosa de chicas). Una vez investigado el logo, me enfoqué en el producto… ¿Nepo qué?

header2

Nepomuk es “la respuesta de KDE a un escritorio semántico”. Consiste en un framework para crear y consultar metadatos de cualquier tipo de recurso.

¿…cómo?

Vamos a Wikipedia para refrescar qué son los metadatos

Metadatos (del griego μετα, meta, «después de» y latín datum, «lo que se da», «dato»), literalmente «sobre datos», son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos, llamado recurso. El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.Para varios campos de la informática, como la recuperación de información o la web semántica, los metadatos en etiquetas son un enfoque importante para construir un puente sobre el intervalo semántico.

Bien, una vez aclarado volvamos sobre el Nepomuk. ¿Para qué me va a servir? Para ubicar recursos a través de metadatos que pueden o no ser fácilmente accesibles (u obvios) para el usuario común.

Cuando hablamos de metadatos, podemos ubicarlos en tres grandes grupos:

  • Metadatos propios de los archivos.
  • Metadatos creados por el usuario (por ejemplo, etiquetas o calificaciones que solemos agregarle a los mp3’s ).
  • Metadatos que no pueden ser obtenidos fácilmente.

En estos últimos es en donde podemos sacarle real provecho a la indexación y categorización por metadatos, es decir, usando el escritorio semántico.

Un ejemplo:

  1. Un usuario descarga un adjunto de un mail. Cuando el adjunto se guarda al disco, se pierden las referencias tanto del que envió el mail como la uri desde donde se descargo dicho mail.
  2. Generación de ranking de aplicaciones, archivos, etc. de usuarios. Por ejemplo, ¿cuál es el usuario que más escrituras hace al disco sda1? ¿Cuál usuario tiene el mayor número de paquetes recibidos?.

Nepomuk esta compuesto principalmente por Soprano, Strigi y K MetaData. Soprano es un framework orientado a objetos para datos RDF y Strigi es un pequeño y simple demonio de búsqueda. KMetaData es una librería que facilita el acceso a los metadatos.

A esta altura se estarán mareando de definiciones y palabras extrañas, pero una definición más para clarificar: ¿Qué son los datos RDF?

Mientras que XML es un lenguaje para modelar datos, RDF es un lenguaje para especificar metadatos. XML falla en la escalabilidad de los datos puesto que el orden de los elementos es antinatural y su mantenimiento es muy difícil y costoso, por el contrario, RDF o Resource Description Framework (RDF) permite la interoperabilidad entre aplicaciones que intercambian información comprensible por la página web, para proporcionar una infraestructura que soporte actividades de metadatos.

Así que, básicamente, la utilización de este tipo de herramientas nos permitiría:

  • Obtener información “no obvia” y al alcance de la mano sobre los datos en nuestra PC. Por ejemplo, imaginen usuarios programadores que al leer el código fuente de su aplicación favorita, puedan obtener información sobre el perfil de los programadores que la desarrollaron.
  • Se podría aumentar ampliamente el potencial de los administradores de paquetes, haciendo un amplio uso de la rica meta información contenida en los paquetes (por ejemplo, los .deb). El hecho de poder darle un valor semántico, facilitaría las resoluciones de dependencias o conflictos. Útil. Incluso antes de resolver un determinado conflicto (por lo general se pide confirmación al usuario) , podría consultar meta información propia del usuario y poder inferir la confirmación del para resolver el conflicto. Esto sería útil, pero ya no me convence tanto.
  • Utilizando Strigi en conjunto con algunas funcionalidades del kernel de Linux (como el subsistema Inotify) podríamos reindexar archivos modificados y ahorrar estar haciendo búsquedas frecuentes por todo el sistema de archivos. Aquí las aplicaciones podrían generar muchos metadatos en relación al log del sistema y como los logs son archivos de texto plano… se puede aprovechar.

Conclusión: si usted, estimado lector amigo, utiliza KDE 4 bien le puede dar una oportunidad a Nepomuk. Lleva un tiempo para aprovechar los beneficios (imagínense indexar y buscar metadatos en todos los archivos del sistema…) pero estimo que con el uso continuo, es una herramienta poderosísima.

Espero que se haya entendido, yo los dejo y sigo probando esta herramienta genial.

Saludos!!

P.D: muy complicado encontrar información sobre Nepomuk que esté escrita en una terminología comprensible y no en sánscrito antiguo como en algunos otros sitios… Por suerte, encontré este post en Infosofía como referente.


Categorías

Más Linux, Recursos

edumix

Ingeniero Informático de Profesión y Desarrollador Web de vocación. Amante de las Nuevas Tecnologías e Internet. "Linux Adicto" y en contacto permanente con "La Nube".

3 comentarios

  1.   Sergio Rondan dijo

    A ver si entiendo. ¿Seria como poner “etiquetas” a todos nuestros archivos?

  2.   gss dijo

    Hola, si no me equivoco es la primera vez que comento.

    Muy buen post, la verdad esto de la semantica en la programacion es muy buen vista como la programacion inteligente del mañana.

    A ver si entiendo. ¿Seria como poner “etiquetas” a todos nuestros archivos?

    No tan solo a archivos, sino carpetas, programas enteros, base de datos, aplicaciones, paginas de internet, etc etc…

    Algo para pensar es que con esto se dejará un poco de lado el concepto de “archivo” para pensar en “librerías”, con metatags y demases..

    La verdad me parece un muy buen aporte, (y acá es donde varios van a pegar el grito), casi parecidito a lo que hace Se7en con su buscador.

  3.   N@ty dijo

    A ver si entiendo. ¿Seria como poner “etiquetas” a todos nuestros archivos?

    Digamos que vendría a ser algo como ponerle etiquetas a los documentos y aprovechar las etiquetas que ya tiene puestas ese recurso, aunque vos no la veas a simple vista, hay mucha información dando vuelta implícita en el recurso que con herramientas de este tipo se puede aprovechar un montón.

    @gss: Bienvenido a la vida de comentarista!! :)

    []…la verdad esto de la semantica en la programacion es muy buen vista como la programacion inteligente del mañana…[]

    Eso espero, sería realmente útil.

    Saludos,

Escribe un comentario