Introducción a la Web Semántica

Este artículo es el inicio de una serie de publicaciones que iré realizando en los próximos meses, relacionadas con la Web Semántica, Ontologías y gestión del conocimiento, y enmarcadas dentro de mi proyecto de investigación de doctorado.

La web, tal como la conocemos hoy en día, podríamos pensar que no tiene nada que ver con la que nació a comienzos de los años 90. De hecho, es cierto que ahora es mucho más bonita, ya no se ven aquellos fondos de pantalla tan llamativos, o los enormes contadores que se ponían en todas las páginas. También las webs de ahora son mayores, están más estructuradas, disponen de mucha más información, y hay millones más de ellas, desde webs corporativos, a medios de comunicación, pasando una inmensa cantidad de bitacoras o blogs, sobre cualquier tema que se nos pueda ocurrir.

Sin embargo, hay una cuestión, la más importante, que hace muy similares a los webs del comienzo y los de ahora, que es la naturaleza de la información. Los webs del presente siguen constando de información básicamente representada en forma de texto. Esta información es fácilmente comprensible por una persona que la lea, pero sin embargo, es muy difícil realizar procedimientos automáticos que obtengan su información semántica, y permitan la existencia de aplicaciones cada vez más demandadas.

En este artículo vamos a ver algunos ejemplos de estas aplicaciones que hacen necesaria la existencia de una web más semántica que la actual, explicaré los mecanismos existentes para dotar a la web de ésta semántica, así como su relación con otras áreas como la representación del conocimiento, y finalmente, daré unos esbozos a la opción propuesta por el W3C.

Usos de la Web Semántica

En este punto voy a presentar una serie de posibles aplicaciones de la Web Semántica, con el objetivo de comprender mejor este concepto, así como las ventajas y las nuevas posibilidades que nos brinda.

Agentes y Servicios

Imaginemos que queremos hacer un viaje desde Barcelona a Praga. Necesitaremos varias cosas para planificarlo, como contratar un vuelo, buscar un alojamiento para los días de nuestra estancia, un medio de transporte desde el aeropuerto al hótel, e incluso una serie de puntos de interés turístico que visitar.

Imaginemos ahora que queremos organizar este viaje con la tecnología web actual. Podríamos buscar en Google, algo como «vacaciones praga desde barcelona», pero a buen seguro, obtendríamos cientos de resultados que no tendrían nada que ver con lo que deseamos, y en el mejor de los casos, obtendríamos páginas aisladas a partir de las cuales podríamos buscar más información.

Para cualquier usuario, lo ideal sería poder acceder a una página en la que indicásemos el origen y destino del viaje, las fechas que abarca, y posiblemente pudiésemos marcar otras opciones complementarias como el transporte y los puntos de interés turístico, y que con todos estos datos, la propia página nos propusiera un vuelo, un hotel, un medio de transporte, y nos proporcionará una lista de monumentos. La página podría limitarse a enlazar con la web de cada uno de estos servicios, o podría ser capaz incluso de realizar la contratación directamente.

Ahora veamos, ¿por qué no podemos realizar todo esto de forma automática con la web actual? La respuesta es sencilla, los contenidos de la web actual no tienen una representación semántica y estándar. Existen por ejemplo comparadores de vuelos, pero éstas páginas se limitan a redirigir las consultas al web de cada compañía, rellenando los diferente formularios, y obtener el html, «deduciendo» de él los datos de respuesta. De esta forma, estos comparadores de vuelo intentan obtener la información semántica de cada portal de vuelos, realizando una interpretación ad-hoc, para cada uno de ellos, tanto del mecanismo de consulta como de la respuesta dada.

Esta opción sin embargo, tiene un coste de desarrollo enorme, ya que hay que realizar un «mapeo» independiente para cada compañía de vuelo, y además, estos mapeos son muy sensibles a las posibles modificaciones en cada web. Aparte de éste, este tipo de solución tiene más problemas, como la enorme complejidad de resolver nuestra solicitud de forma global, o la «imposibilidad» de poder realizar los pagos de forma única.

Como casi siempre en la Ingeniería del Software, la solución pasa por abstraer y estandarizar. Imaginemos ahora que cada compañía de vuelo habla un mismo idioma, ofreciendo la información de cada vuelo en un formato que conste de: origen, destino, fecha salida, fecha llegada, precio. Podríamos crear fácilmente un programa que obtuviera estos datos y se los mostrase al usuario. Este programa sería indendiente a los posibles cambios de los webs de cada compañía, ya que éstas seguirían proporcionando la información de forma estándar, y también permitiría incorporar automáticamente, sin ningún coste extra, nuevas compañías a la comparativa. Incluso, si cada compañía dispusiera de servicios web para la realización de consultas o contrataciones, se podrían realizar éstas de forma automática.

Lo que hemos hecho en este último paso es añadir información semántica a los vuelos presentados por cada compañía, de forma que cada vuelo se representa según un modelo común. Esto mismo podríamos hacerlo con las cadenas de hoteles, compañías de transportes y departamentos de turismo, con lo cual podríamos conseguir nuestro objetivo.

Desde luego, estamos todavía lejos de poder conseguir algo así, ya que hay muchos factores involucrados aparte de los meramente tecnológicos, pero al menos, mediante la incorporación de información semántica, estamos sentando las bases para que en un futuro esto sea posible.

Gestión del Conocimiento en una empresa

Ésta es un área en la que se están dedicando grandes inversiones en este momento. Gracias a la informática, la cantidad de información de la que dispone una empresa es enorme. Hasta hace poco el problema era tener los datos informatizados para agilizar procesos, pero ahora, con las ingentes cantidades de información existentes, surgen otras posibilidades, como la minería de datos, o la localización de información.

Imaginemos una empresa de desarrollo con miles de documentos almacenados en su intranet, y un desarrollador que desea buscar información relativa a proyectos pasados y que pueda ser de utilidad para un proyecto en el que participa. La solución habitual suele ser buscar tal como lo haríamos en internet, mediante la utilización de palabras o frases que pensamos pueden aparecer en estos documentos, sin embargo, este tipo de búsquedas nos devolverán muchos resultados superfluos, y puede que algunos documentos relevantes, ni siquiera estén incluidos.

Ahora imaginemos otra situación, en la que la empresa dispone de una representación formal del conocimiento que puede gestionar, por ejemplo mediante una taxonomía de temáticas, y una serie de conceptos como proyectos, clientes, bugs, etc… Si cada documento estuviera clasificado según este conocimiento, la localización de información relevante sería mucho mayor, ya que cada documento, aparte de su contenido, dispondría de una interpretación semántica que un programa podría procesar de forma automática, para determinar su adecuación con la información requerida por el usuario.

Más allá aún, podríamos tener una empresa formada por varios departamentos, y que la representación del conocimiento entre ellos no fuera homogénea, por ejemplo, debido a que personas en diferentes ámbitos pueden llamar de diferente forma a una misma cosa. Se podrían crear mapeos entre cada representación, de forma que las personas de un departamento podrían localizar documentos de otros departamentos, sin tener que conocer estas diferentes nomenclaturas.

Todo esto es posible ya hoy en día mediante la utilización de técnicas de representación del conocimiento, como las ontologías.

Tras estos ejemplos, en la siguiente sección describiremos las bases sobre las que se sustenta la Web Semántica.

Páginas: 1 2 3

Twitter Digg Delicious Stumbleupon Technorati Facebook Email

10 Respuestas para “Introducción a la Web Semántica”

  1. Hablando de comparadores de vuelos, en este caso en su mayoría lowcost, o de bajo coste, hye visto varios ejemplos: http://www.trabber.com o htttp://www.tracerdog.com.

  2. Hola en primer lugar por felicitarte por tu trabajo,
    te cuento que estoy realizando una investigación sobre RDF y quisiera pedirte ayuda sobre esta tecnología, como es su sintaxis, etc. de antemano gracias por tu ayuda.

    Saludos

  3. Hola Guildo, en el W3C tienes abundante información sobre RDF http://www.w3.org/RDF. La especificación actual la tienes en http://www.w3.org/TR/REC-rdf-syntax/

  4. Muy buen artículo. Hay un libro de Miguel Ángel Abián sobre la Web semántica y sus tecnologías en javaHispano, en la dirección http://www.javahispano.org/contenidos/es/el_futuro_de_la_web/ . Es excelente, y también he visto artículos de ese autor sobre ontologías y agentes en Web Semántica Hoy (http://www.wshoy.sidar.org/).
    Muchas gracias por tu trabajo.

    Luis

  5. hola saludo a todos ustedes amigos de la sabiduria les cuento estoy en un eprieto necesito una aplicacion realizada con protégé y oracle enlazados, lo necesito lo mas antes posible, he tratado de obtener informacion del tema pero no encuentro en español y lo peor de todo es que hasta ahora nose siquiera como ejecutar o cual es la manera de arrancar una aplicacion con protégé espero que me puyedan ayudar si tuviesen asi un proyecto como el que mencione les agradecere muchisimo si me lo envian a mi correo explicandome como lo crearon a mi correo luis_oficinaa@hotmail.com

  6. El contenido esta muy bueno espero que si puedes publicar algo con respecto a la minería de la web semántica.

Trackbacks/Pingbacks

  1. EsLoMas.com » Algunos experimentos básicos con Protégé y Jena - 31. May, 2007

    […] Por fin estoy de vuelta. Hace casi mes y medio que no escribo nada en el blog, pero han sido por causas mayores, no es que me haya olvidado de él, así que no ha pasado a formar parte de esos millones de blogs abandonados que hay por Internet. Voy a aprovechar esta vuelta a la rutina semanal de escritura para recopilar una serie de cosas que he ido utilizando en los últimos meses, en la elaboración de algunos experimentos dentro de mi proyecto de doctorado relacionado con la Web Semántica. Posiblemente a mucha gente le suene a chino, aunque la verdad es que hay gente que usa esta serie de cosas. Si no estás al corriente de esta serie de cosas y tienes algo de curiosidad, puedes echar un vistazo a la introducción a la web semántica que escribí hace unos meses, o a este otro post algo más teórico sobre técnicas y lenguajes para la representación del conocimiento. […]

  2. EsLoMas.com » Almacenes de tripletas RDF - 20. May, 2008

    […] RDF es un modelo de metadatos basado en el concepto de sentencias de la forma “sujeto-predicado-objeto”, denominadas tripetas RDF. Este modelo ofrece una adecuación mayor para la representación del conocimiento que el modelo relacional de las bases de datos tradicionales, por lo que se ha utilizado para definir otros estándares como RDFS y OWL, enfocados a la representación del conocimiento como ontologías, tal como he explicado en algún post anterior. […]

  3. Introducción a la Web semántica « Web Semántica - 09. Feb, 2009

    […] Introducción a la Web semántica By jmorwebsem La web, tal como la conocemos, podríamos pensar que no tiene nada que ver con la que nació a comienzos de los años 90. Ahora están mejor estructuradas, disponen de más información, y hay millones de ellas, desde webs corporativos, medios de comunicación, pasando una inmensa cantidad de bitacoras o blogs, sobre cualquier tema. Sin embargo los webs del comienzo y los de ahora son muy similares, debido a la naturaleza de la información. Los webs del presente siguen constando de información básicamente representada en forma de texto. Esta información es fácilmente comprensible por una persona, pero, es muy difícil realizar procedimientos automáticos que obtengan su información semántica, y permitan la existencia de aplicaciones cada vez más demandadas. En este artículo se verán algunos ejemplos de estas aplicaciones que hacen necesaria la existencia de una web semántica. […]

  4. EsLoMas.com » Introducción a las folksonomías, ventajas e inconvenientes - 14. Ene, 2010

    […] Tim Berners-Lee publicó su visión de lo que debería ser la Web del futuro, a la que llamó la Web Semántica [1], basada en una web en la que toda la información tiene una información semántica asociada […]