A pesar de mis reticiencias habituales a escriir sobre temas meramente técnicos en el blog, me apetece comentar una herramienta que me encontré este mes pasado.
Fue durante la realización de los trabajos para la última asignatura del Máster, Nuevos Avances en Web Semántica. El trabajo consistía en la realización de dos artículos, bajo ciertas normas, referente a unos temas de Web Semántica.
Fue un trabajo de pura investigación, leyendo artículos sobre un tema del que no me considero un experto dominador para ver qué podía sacar en claro del asunto, navegando por Internet.
Aproveché para retomar uno de mis RSS más abandonado (pero no menos interesantes), el de Planet RDF, y llegué al blog de Iván Herman, en concreto a un post en el que hablaba de Zotero.
Zotero es una extensión de Firefox que te permite recopilar información acerca de artículos, libros, etc. mientras navegas por ellos via web.
De esta manera si uno llega, por ejemplo, a CiteSeer (Sitio en que se recopilan artículos y las citas que la gente realiza de ellos) y entra en un artículo particular aparecerá un icono en la barra de direccioens que el permitirá almacenar toda la información referente al artículo (en este caso llega hasta el nombre y apellidos de los editores).
Esta tontería es muy útil cuando estás navegando a través de miles de referencias, ya que pasados 5 minutos no recuerdas para qué servía ninguno de los artículos visitados.
Además, esta herramienta te permite exportar a distintos formatos entre los que se incluye el BibTex, lenguaje de bibliografías para LaTeX, por lo que incluir todos los artículos que has usado es tan simple como copiar y pegar.
Pero Zotero funciona en muchos más sitios y no estoy seguro de que hayan hablado con los desarrolladores de todos los sitios o que estos sitios ofrezcan, directamente, la capacidad de importar estos datos.
¿Cómo lo hacen entonces? Por lo que comentan en su documentación parecen basarse en el formato de las URIs para detectar que se encuentran en alguna página compatible ("ey, estoy en amazon") y en el análisis del código HTML de las páginas para detectar los campos más relevantes (en el caso de Amazón buscan <input> que tenga ciertos nombres, por ejemplo).
Este uso se parece bastante al que los microformatos (o RDFa en su defecto) proponen para la web semántica, el uso de ciertos atributos de HTML para incorporar semántica a las webs, de manera que un sitio cualquiera (éste, por ejemplo) pueda ser procesado por un programa (Zotero en este caso) para extraer cierta información (el título, tema y autor de los posts, por ejemplo) de manera automatizada.
Quizás fuera interesante la existencia de una ontología estandarizada (al menos reconocida universalmente) que estuviera soportada por esta herramienta, de manera que se pudiera incorporar a cualquier sitio, aunque quizás ya exista y todo sea cosa de investigar un poco más.
¿Habeis visto? ¿A que parezco profesional y todo ya? Bueno, investigador.
2 comentarios:
Quizá me lo instale en el portátil del trabajo a ver cómo funciona con páginas de cosas de programación
Resulta interesante, también, como ejemplo limitado de los servicios que podría llegar a ofrecer la Web Semántica.
Publicar un comentario