Introducción a la Web Semántica

Bases de la Web Semántica

En la sección anterior hemos visto un par de ejemplos sobre las posibilidades qué nos brinda la web semántica, en esta sección, vamos a ver, sin entrar en mucho detalle, las bases teóricas que hacen posible su existencia.

Como hemos visto en los ejemplos de la sección anterior, la web semántica gira sobre la existencia de mecanismos que permiten definir de una forma homogénea y consensuada, la información semántica. Esto que puede parecer algo nuevo, es un tema que se ha estado estudiando durante mucho tiempo en otras ramas de la informática, como la Inteligencia Artificial, bajo el nombre de Representación del Conocimiento.

Hay cantidad de información publicada sobre Representación del Conocimiento desde hace varias décadas, pese a lo relativamente reciente del concepto de Web Semántica. La situación es similar a cuando se creó la Web a principios de los 90, fue algo nuevo, pero hacía muchos años en los que se venía trabajando en técnicas de hipertexto y lenguajes de etiquetado como SGML, lo que posibilitó su expansión.

Redes Semánticas

Una forma frecuente de representar el conocimiento ha sido desde la década de los 50, la utilización de Redes Semánticas. Típicamente estas redes se componen de una serie de globos representando conceptos, y una serie de arcos uniendo estos globos, y representando relaciones entre los conceptos.

Podemos identificar tres categorías diferentes de redes semánticas:

  • Redes Is-As: frecuentemente se mencionan como sinónimo de las redes semánticas, aunque también las dos siguientes categorías están englobadas dentro del mismo concepto. Las Redes Is-As representan básicamente una organización taxonómica, en la que una serie de objetos y conceptos se representan mediante nodos, y se relacionan mediante relaciones de herencia utilizando arcos entre ellos. Mediante ellas se pueden representar gran variedad de escenarios de conocimiento diferentes, como una taxonomía animal, o la estructura de contenidos de un web, sin embargo, hay cuestiones más complejas que las meras relaciones de herencia o pertenencia a un conjunto, como propiedades de cardinalidad, por ejemplo, que no pueden representarse con ellas.
  • Redes de Marcos: las redes de Marcos o Frames, surgen en 1975. En ellas, los conceptos y objetos se representa mediante cajas o frames, y sus relaciones mediante líneas que las unen. Sin embargo, a diferencia de en las Redes Is-As, los frames disponen de una serie de slots con los que se puede añadir atributos de valor, procedimientos, disparadores, valores por defecto o restricciones, a cada frame.
  • Ontologías: surjen asociadas al desarrollo de la red semántica con el objetivo de disponer de mecanismos más adecuados que los anteriores y que permitan el entendimiento del conocimiento común a las diferentes partes, usuarios, programas y desarrolladores.

Ontologías

La definición de Ontología más usada en la actualidad es la proporcionada por Gruber, «una especificación formal y explícita de un conocimiento compartido«. En esta definición, «explícita» se refiere a la necesidad de detallar los diferentes conceptos que forman la ontología, «formal» indica que el conocimiento que modelemos debe representarse según un lenguaje formalizado y «compartido» indica que la ontología modela el conocimiento común sobre la materia, para las diferentes personas que deben usarla.

Uno de los primeros lenguajes ontológicos para la web, fue Simple HTML Ontology Extensions (SHOE), creado en 1999, y que permitía incorporar en un documento html, una serie de etiquetas con información semántica. Sin embargo, este lenguaje adolecía de algunos inconvenientes importantes, como la forma en la que se etiquetaban los contenidos, y el escaso poder expresivo que se podía alcanzar.

Por las mismas fechas, el W3C publicó una especificación que sería la base de la mayoría de lenguajes ontológicos de la actualidad, RDF. El W3C diseño el lenguaje RDF como una herramienta de modelado de metadatos basado en sintaxis XML, aunque es posible utilizar también otros mecanismos de representación.

A partir de RDF, fueron surgiendo otras tecnologías que lo ampliaban aumentando su poder expresivo, con el fin de poder representar de la forma más potente posible el conocimiento de cada dominio. La más significativa de ellas fue DAML+OIL, promovido también por el W3C y que fue el precursor del lenguaje Web Ontology Language (OWL), el cual está llamado a ser uno de los ejes principales de la Web Semántica.

Web Ontology Language – OWL

OWL es un lenguaje derivado de DAML+OIL y basado en RDF. Se diseñó teniendo entre uno de sus objetivos, ofrecer un mecanismo común de representar el conocimiento en la web, de forma que fuera posible procesarlo de forma automática. Por lo tanto, OWL está pensado para que sea «leído» por máquinas y no por humanos.

Aparte de este objetivo, se tuvieron en cuenta otra serie de cuestiones en su diseño, entre las que destacan:

  • Compartición de ontologías: las ontologías deberían poder ser «públicamente» accesibles, de forma que diversas fuentes puedan definir contenidos a partir de ellas, o extenderlas si su modelo de dominio lo requiere.
  • Evolución de ontologías: se debería poder indicar la versión de una ontología, con el objetivo de que cambios en ella no afecten a fuentes externas que la puedan estar utilizando
  • Integración de ontologías: dos ontologías pueden representar un mismo concepto de dos formas diferentes. El lenguaje debería permitir establecer estas equivalencias, de forma que la información pudiera ser «traducida» de una ontología a otra.
  • Detección de inconsistencias: dos o más ontologías pueden ser contradictorias, por lo que debería ser posible detectar estas inconsistencias.
  • Equilibrio entre poder de expresividad y escalabilidad: el lenguaje debería ser lo suficientemente amplio como para poder representar muy diversos dominios de conocimiento, pero debería poder ofrecer también mecanismos para razonar eficientemente sobre ellos. Estos dos requerimientos suelen ser típicamente divergentes, por lo que el objetivo principal es encontrar un equilibrio entre ellos.
  • Sencillez de uso: el lenguaje debería ser sencillo de aprender e interpretar
  • Compatible con otros estándar: el lenguaje debería ser compatible con otros estándares de la industria, principalmente XML y los lenguajes relacionados, como XML Schema y RDF, así como con otros estándares de modelado como UML.
  • Internacionalización: debería poderse crear ontologías multiidioma y ofrecer diferentes vistas de ellas para cada cultura.

A partir de los posibles escenarios de uso descritos en la sección anterior, y de los principales objetivos expuestos, se identificaron una serie de requisitos que debía cumplir el lenguaje, como la utilización de identificadores URI, la posibilidad de incorporar metadatos o información de versión en las ontologías, la posibilidad de utilizar tipos estándar de datos basados en XML Schema, la posibilidad de especificar equivalencias entre clases o instancias, la posibilidad de espeficar restricciones de cardinalidad, la posibilidad de crear clases de conceptos a partir de expresiones complejas como subclases o combinaciones booleanas, la sintaxis XML como base del lenguaje, y el soporte para juegos de caracteres multilenguaje, por citar los más destacados.

Los tres diferentes niveles de OWL

Fruto de algunos de los objetivos y requisitos anteriores, el W3C decidió crear tres sublenguajes de OWL, cada uno con un poder de expresividad mayor que el anterior.

  • OWL Lite: permite crear jerarquías de clasificación y restricciones sencillas. Por ejemplo, permite restricciones de cardinalidad, pero sólo del tipo 0 ó 1. Ofrece una forma sencilla de migrar un Thesaurus o Taxonomía a OWL.
  • OWL DL: está orientada a los casos en los que se necesita el máximo poder expresivo, pero sin perder por ello la completitud computacional de los sistemas de razonamiento. Se denomina así por permitir representar logica descriptiva (DL), un subconjunto de la lógica de primer orden.
  • OWL Full: ofrece la máxima capacidad de expresividad, pero no garantiza que se puedan realizar razonamientos en tiempos computables. Una de las diferencias más destacadas con OWL DL, es que en OWL FULL, se permite que una clase sea a la vez una clase e instancia de otra clase.

Cada sublenguaje es una extensión del anterior, por lo que cualquier ontología OWL Lite es también OWL DL y OWL Full, sin embargo, lo contrario no es cierto.

En esta sección hemos dado una introducción a la representación del conocimiento, a las ontologías, y con un poco más de detalle a OWL. En la siguiente veremos qué papel juega OWL dentro de la visión de la web semántica del W3C, y de su precursor, Tim Berners-Lee.

Páginas: 1 2 3

Twitter Digg Delicious Stumbleupon Technorati Facebook Email

10 Respuestas para “Introducción a la Web Semántica”

  1. Hablando de comparadores de vuelos, en este caso en su mayoría lowcost, o de bajo coste, hye visto varios ejemplos: http://www.trabber.com o htttp://www.tracerdog.com.

  2. Hola en primer lugar por felicitarte por tu trabajo,
    te cuento que estoy realizando una investigación sobre RDF y quisiera pedirte ayuda sobre esta tecnología, como es su sintaxis, etc. de antemano gracias por tu ayuda.

    Saludos

  3. Hola Guildo, en el W3C tienes abundante información sobre RDF http://www.w3.org/RDF. La especificación actual la tienes en http://www.w3.org/TR/REC-rdf-syntax/

  4. Muy buen artículo. Hay un libro de Miguel Ángel Abián sobre la Web semántica y sus tecnologías en javaHispano, en la dirección http://www.javahispano.org/contenidos/es/el_futuro_de_la_web/ . Es excelente, y también he visto artículos de ese autor sobre ontologías y agentes en Web Semántica Hoy (http://www.wshoy.sidar.org/).
    Muchas gracias por tu trabajo.

    Luis

  5. hola saludo a todos ustedes amigos de la sabiduria les cuento estoy en un eprieto necesito una aplicacion realizada con protégé y oracle enlazados, lo necesito lo mas antes posible, he tratado de obtener informacion del tema pero no encuentro en español y lo peor de todo es que hasta ahora nose siquiera como ejecutar o cual es la manera de arrancar una aplicacion con protégé espero que me puyedan ayudar si tuviesen asi un proyecto como el que mencione les agradecere muchisimo si me lo envian a mi correo explicandome como lo crearon a mi correo luis_oficinaa@hotmail.com

  6. El contenido esta muy bueno espero que si puedes publicar algo con respecto a la minería de la web semántica.

Trackbacks/Pingbacks

  1. EsLoMas.com » Algunos experimentos básicos con Protégé y Jena - 31. May, 2007

    […] Por fin estoy de vuelta. Hace casi mes y medio que no escribo nada en el blog, pero han sido por causas mayores, no es que me haya olvidado de él, así que no ha pasado a formar parte de esos millones de blogs abandonados que hay por Internet. Voy a aprovechar esta vuelta a la rutina semanal de escritura para recopilar una serie de cosas que he ido utilizando en los últimos meses, en la elaboración de algunos experimentos dentro de mi proyecto de doctorado relacionado con la Web Semántica. Posiblemente a mucha gente le suene a chino, aunque la verdad es que hay gente que usa esta serie de cosas. Si no estás al corriente de esta serie de cosas y tienes algo de curiosidad, puedes echar un vistazo a la introducción a la web semántica que escribí hace unos meses, o a este otro post algo más teórico sobre técnicas y lenguajes para la representación del conocimiento. […]

  2. EsLoMas.com » Almacenes de tripletas RDF - 20. May, 2008

    […] RDF es un modelo de metadatos basado en el concepto de sentencias de la forma “sujeto-predicado-objeto”, denominadas tripetas RDF. Este modelo ofrece una adecuación mayor para la representación del conocimiento que el modelo relacional de las bases de datos tradicionales, por lo que se ha utilizado para definir otros estándares como RDFS y OWL, enfocados a la representación del conocimiento como ontologías, tal como he explicado en algún post anterior. […]

  3. Introducción a la Web semántica « Web Semántica - 09. Feb, 2009

    […] Introducción a la Web semántica By jmorwebsem La web, tal como la conocemos, podríamos pensar que no tiene nada que ver con la que nació a comienzos de los años 90. Ahora están mejor estructuradas, disponen de más información, y hay millones de ellas, desde webs corporativos, medios de comunicación, pasando una inmensa cantidad de bitacoras o blogs, sobre cualquier tema. Sin embargo los webs del comienzo y los de ahora son muy similares, debido a la naturaleza de la información. Los webs del presente siguen constando de información básicamente representada en forma de texto. Esta información es fácilmente comprensible por una persona, pero, es muy difícil realizar procedimientos automáticos que obtengan su información semántica, y permitan la existencia de aplicaciones cada vez más demandadas. En este artículo se verán algunos ejemplos de estas aplicaciones que hacen necesaria la existencia de una web semántica. […]

  4. EsLoMas.com » Introducción a las folksonomías, ventajas e inconvenientes - 14. Ene, 2010

    […] Tim Berners-Lee publicó su visión de lo que debería ser la Web del futuro, a la que llamó la Web Semántica [1], basada en una web en la que toda la información tiene una información semántica asociada […]