Wikia

Conocimiento, trabajo en grupo y tecnologias de soporte Wiki

Esquemas de la red semántica

Discusión0
85páginas en el wiki


Los responsables de los primeros esquemas de representación formalizados fueron Quillian y Shapiro & Woddmansee.

Los elementos básicos que encontramos en todos los esquemas de redes son:

  1. Estructuras de datos en nodos, que representan conceptos, unidas por arcos que representan las relaciones entre los conceptos.

  2. Un conjunto de procedimientos de inferencia que operan sobre las estructuras de datos.

Básicamente, podemos distinguir tres categorías de redes semánticas:

  1. Redes IS-A, en las que los enlaces entre nodos están etiquetados.

  2. Grafos conceptuales: en los que existen dos tipos de nodos: de conceptos y de relaciones

  3. Redes de marcos: en los que los puntos de unión de los enlaces son parte de la etiqueta del nodo.

En general, cuando se habla de "redes semánticas" se suele hacer referencia a uno de estos esquemas, normalmente a las redes IS-A o a los esquemas basados en marcos, que comparten ciertas características fundamentales. De entre estas características compartidas destacamos la herencia por defecto. En una red semántica, los conceptos están organizados en una red en la que existe un nodo superior al que se le asigna uno o varios nodos hijos, que a su vez tienen otros conceptos hijos y así sucesivamente hasta que se alcanza el final, cuyos nodos ya no son conceptos sino instancias.

A continuación estudiamos los tres tipos de esquemas.

1) Redes IS-AEditar sección

Sin duda el tipo de red semántica por excelencia es el de redes IS-A. De hecho muchas veces se menciona este tipo como sinónimo de "red semántica".

Una red IS-A es una jerarquía taxonómica cuya espina dorsal está constituida por un sistema de enlaces de herencia entre los objetos o conceptos de representación, conocidos como nodos. Estos enlaces o arcos pueden estar etiquetados "IS-A", también "SUPERC", "AKO", "SUBSET", etc.

Las redes IS-A son el resultado de la observación de que gran parte del conocimiento humano se basa en la adscripción de un subconjunto de elementos como parte de otro más general. Las taxonomías clásicas naturales son un buen ejemplo: un perro es un cánido, un cánido es un mamífero, un mamífero es un animal. Obteniendo un número de proposiciones:

x (perro (x)) cánido (x); x (cánido (x)) mamífero (x); x (mamífero (x)) animal (x);

La estructuración jerárquica facilita que la adscripción de propiedades a una determinada categoría se reduzca a aquellas que son específicas a la misma, heredando aquellas propiedades de las categorías superiores de la jerarquía, tradicionalmente de una forma monotónica.

Ejemplo de red IS-A con herencia de propiedades:

Fig4-11.gif




El concepto de herencia es fundamental para entender el funcionamiento de las redes semánticas. Definimos la herencia como el sistema de razonamiento que lleva a un agente a deducir propiedades de un concepto basándose en las propiedades de conceptos más altos en la jerarquía.

Así, en el ejemplo jerárquico el agente sería capaz de atribuir las propiedades "breathes" o "has gills" al concepto "shark" sin que éstas se encuentren específicamente mencionadas.

Los nodos se han usado para representar muchas cosas, pero la división más importante es la que divide entre los que representan un sólo individuo o varios. Los nodos situados en lo más bajo de la jerarquía y que denotan individuos son llamados tokens, mientras que los nodos superiores, que denotan clases de individuos son considerados types.

Las jerarquías IS-A presentan un número impresionante de posibilidades, pero también una desventaja: al aumentar el número de enlaces, aumenta progresivamente la complejidad computacional para seguirlos. Este problema bien conocido ha dado lugar a que se haya propuesto que, en lugar de establecer esta y otras posibles taxonomías de enlaces IS-A, se use el enlace IS-A de propósito general, que al ser programable, permite establecer el tipo de enlace adecuado a cada situación particular. De este modo se puede representar una semántica compleja, específicamente mediante el uso de prototipos, en los que una determinada situación se representa mediante nodos y arcos específicos. Por ejemplo, la aserción "The book rests on the table" se puede representar así:

Fig4-12.gif





Problemas:

Este tipo de representación exige una gran cantidad de trabajo de inferencia: es relativamente fácil determinar si dos frases significan lo mismo pero no es tan fácil determinar si una frase es la consecuencia lógica de otra.

Otro problema está en la diversidad de tipos de arcos establecidos. Esto provoca que de red semántica a red semántica el significado de los arcos y los nodos varíe, provocando ambigüedad en la notación. Por ejemplo, la red semántica de la siguiente figura puede tener tres significados distintos:

Fig4-14.gif



Ambigüedad en redes semánticas


  1. Representa el concepto de un teléfono: tal cosa existe.

  2. Representa un teléfono negro específico.

  3. Representa la aseveración de la relación entre los teléfonos y el negro: algunos o todos los teléfonos son negros.

Para concluir este apartado, resumimos los tres problemas más reconocidos de los esquemas de representación basados en redes semánticas:


  1. La elección de los nodos y arcos es crucial en la fase de análisis. Una vez se ha decidido una estructura determinada, es muy complicado cambiarla.

  2. Dificultad para expresar cuantificación. Por ejemplo en expresiones tales como "algunos pájaros vuelan" o "todos los pájaros pían".

  3. Las redes semánticas presentan grandes dificultades para representar la dimensión intensional. Por ejemplo en proposiciones tales como "Pedro cree que Ana sabe conducir".

Esto llevó a idear otros esquemas de representación con una estructura más compleja que simples nodos y arcos, que fuesen capaces de dar cabida a éstas y otras situaciones. John Sowa propuso los grafos conceptuales.

2) Grafos conceptualesEditar sección

Los grafos conceptuales se diferencian de las redes IS-A en que los arcos no están etiquetados, y los nodos son de dos tipos:

  1. Nodos de concepto, que pueden representar tanto una entidad como un estado o proceso.

  2. Nodos de relación, que indican cómo se relacionan los nodos de concepto.

Por tanto, son los nodos de relación los que hacen el papel de enlaces entre las entidades.

Existen dos notaciones para los grafos conceptuales, la forma lineal (textual) y los diagramas, que presentan tres tipos de elementos notacionales:


  1. rectángulos, que marcan los nodos de concepto

  2. círculos, que marcan los nodos de relación,

  3. flechas direccionadas, que marcan los arcos.


[CONCEPT1] (REL.) [CONCEPT2


Fig4-15.gif

Tipos de notaciones de grafos conceptuales


Una gran ventaja del esquema de grafos es que permite restringir la generación de representaciones sin sentido por medio de lo que Sowa denomina grafos canónicos. Tomando como base la conocida frase:

"Colorless green ideas sleep furiously" (Chomsky)

representada por el grafo [SLEEP] (AGNT) [IDEA] (COLOR) [GREEN], establece la idea de canon, que está basada en la noción de jerarquía de tipos, según la cual existe una función tipo que proyecta conceptos sobre un conjunto C cuyos elementos son etiquetas de tipo. Esta función corresponde a los arcos IS-A que vimos anteriormente. El canon contiene la información necesaria para derivar otros grafos canónicos y tiene cuatro componentes:

  1. Una jerarquía de tipos T

  2. Un conjunto de indicadores de individuos I

  3. Una relación de conformidad: que relaciona etiquetas en T con indicadores en I

  4. Un conjunto finito de grafos conceptuales B, llamado base canónica, que contiene todos las etiquetas de tipos en T y todos los referentes, ya sea en I o en el referente genérico *

Las reglas de formación que permiten que un grafo canónico se derive de otro son las de copia, unión, restricción y simplificación. Además un grafo puede convertirse en canónico mediante otros dos procesos:


  1. Perception: un grafo es canónico si es construido por el assembler mediante un icono sensorial.

  2. Insight': se pueden concebir los grafos conceptuales arbitrarios como canónicos.


La frase de Chomsky sería bloqueada por los cánones:


Fig4-17.gif


De este modo se pueden generar grafos bastante complejos para representar conceptos. Como ejemplo, el grafo de transacción


Fig4-18.gif


El que inicia la transacción es un customer, que es el receptor de un acto de give y el agente de otro give. El objeto de la transacción es una entity, que es el objeto del primer give. El instrumento de la transacción es money, que es también el objeto del segundo give. La fuente de la transacción es un seller que es el agente de un give y el receptor del otro.

Hay que mencionar las redes de dependencia conceptual, que aunque no han tenido la misma repercusión que los grafos conceptuales, contienen la base que, junto con las redes semánticas, usó Sowa para su esquema.

La idea central es crear una representación canónica de una frase, en este caso basándose en ciertos primitivos semánticos. En la teoría original tan sólo se contemplaban siete primitivos, que incluían cinco acciones físicas: move, propel, ingest, expel y grasp y dos cambios de estado: ptrans (transferencia física en el espacio) y mtrans (transferencia mental de información). La frase "John threw a ball to Mary" es representada del modo siguiente:

Fig4-19.gif


Ejemplo de dependencia conceptual


La teoría original evolucionó para incluir unidades de memoria más desarrolladas, llamadas scripts. Un script es una secuencia de esquemas que "cuenta una historia", el ejemplo tradicional es el del restaurante: entrar, pedir la comida, pagar al camarero, etc., serían los esquemas que conforman el script. Los scripts, sin embargo, tienen mucho en común con la notación de los esquemas de marcos.

3) Esquemas de marcosEditar sección

El primer proponente de la noción de marco fue Marvin Minsky.

La fundamentación psicológica de los marcos es parecida a la de los scripts: cuando nos enfrentamos con una situación determinada, intentamos ajustarla a otra parecida de la que ya tenemos experiencia previa y esperamos que aparezcan un número de elementos comunes y se sucedan algunas situaciones.

Por ejemplo, si entramos en una habitación de hotel, esperamos encontrar una cama, un armario, un baño, etc. Nuestra mente reconocerá las instancias específicas de la nueva habitación y los acomodará al estereotipo que ya poseemos. La base de la teoría la conforman, por tanto, las situaciones estereotipadas.



Informalmente, un marco es una estructura de datos compleja que representa una situación estereotipada, por ejemplo hacer una visita a un enfermo o acudir a una fiesta de cumpleaños. Cada marco posee un número de casillas (slots) donde se almacena la información respecto a su uso y a lo que se espera que ocurra a continuación. Al igual que las redes semánticas, podemos concebir un marco como una red de nodos y relaciones entre nodos (arcos). A nivel práctico, podemos considerar los marcos como una red semántica con un número de posibilidades mucho mayor, entre las que destacan especialmente, la capacidad de activación de procesos (triggering) y de herencia no-monotónica mediante sobrecontrol (overriding).

Formalmente, un marco M es una lista de atributos (slots) y valores (S, V). El valor V de un slot S puede ser:


  • un valor simple, cuyo tipo se halla determinado por el slot mismo, por una función que devuelve un valor de ese tipo, o por un puntero al valor de otro slot de la jerarquía

  • una lista de atributos:valores, donde los atributos son funciones booleanas y los valores pueden ser funciones que devuelven valores del tipo del valor del slot, o constantes del tipo del valor del slot.


La organización jerárquica de los marcos es una de sus características más destacables. Los marcos se organizan en jerarquías que presentan los mismos sistemas de herencia que encontrábamos en las redes IS-A. De hecho, una estructura de marcos no es más que una ampliación de una estructura de redes IS-A básica, donde los nodos han sido reemplazados por grupos estructurados de información (los marcos).

Una jerarquía de marcos es un árbol en el que cada uno de los nodos es un marco. Para cada nodo hijo, el enlace con el nodo padre es un enlace de herencia. El nodo hijo hereda todos los slots de su padre a menos que se especifique lo contrario (sobrecontrol). Esta es una gran diferencia con las redes IS-A, donde la herencia es siempre monotónica, es decir no hay posibilidad de negar la herencia de propiedades en un contexto. Los nodos pueden ser de dos tipos: nodos de clase y nodos de instancia. Todos los nodos internos (no terminales) han de ser nodos de clase.

La característica que la herencia trae consigo es el concepto de valores por defecto (defaults). En un marco se puede especificar un valor determinado o bien un valor por omisión ), en cuyo caso heredará sin más el valor de su antecesor. Por ejemplo, la clase (nodo de clase) ave, tendrá el valor por omisión vuela como "cierto", aunque algunos nodos de instancia hijos, por ejemplo avestruz, no posean esta propiedad. Esta instancia concreta puede ser obligada a no heredar esta propiedad asignándole el valor "falso", mientras que otras propiedades, como tiene_alas, sí serían heredadas por defecto (aunque en otras instancias, como en el caso de kiwi, ésta habría de ser negada).

Esta misma disposición es la que presentan los sistemas orientados al objeto actuales, aunque en éstos, los nodos de instancia no son considerados nodos, sino objetos. El término orientación al objeto se comenzó a utilizar con un significado muy parecido al que de él tenemos hoy por los proponentes de esquemas de representación basados en marcos a finales de los años 70.

Podemos resumir las principales características de los marcos en las siguientes:


  • Precisión (Explicitness): se precisan los objetos, las relaciones entre objetos y sus propiedades; en ausencia de evidencia contraria se usan valores por omisión

  • Activación dinámica de procesos (Triggering): se pueden adjuntar procedimientos a un marco o alguno de sus componentes y ser llamados y ejecutados automáticamente tras la comprobación de cambio de alguna propiedad o valor (p. ej. if-needed, if-added)

  • Herencia por defecto no-monotónica: los marcos están conceptualmente relacionados, permitiendo que atributos de objetos sean heredados de otros objetos predecesores en la jerarquía

  • Modularidad: la base de conocimiento está organizada en componentes claramente diferenciados


El razonamiento en un esquema basado en marcos se lleva a cabo mediante dos mecanismos básicos: el reconocimiento y la herencia. En el entorno de los marcos el proceso de reconocimiento de patrones se centra en encontrar el lugar más apropiado para un nuevo marco dentro de la jerarquía de marcos. Esto requiere que el mecanismo de reconocimiento sea capaz de recibir información sobre la situación existente (en forma de marco) y lleve a cabo una búsqueda del marco más adecuado de entre todos los contenidos en la base de conocimiento.

Teniendo en cuenta las características de herencia anteriormente descritas, el conjunto de propiedades no tiene por qué encontrarse a nivel local, sino que pueden estar atribuidas a conceptos (marcos) en posiciones superiores en la jerarquía. Podemos decir que estos dos mecanismos complementarios de razonamiento conforman el núcleo de lo que entendemos por comportamiento inteligente, y actúan como precursores de procesos de razonamiento más especializados.

El modo en que estos dos mecanismos básicos de razonamiento interactúan se muestra en la siguiente figura :

Los problemas en el proceso de reconocimiento surgen cuando los valores por omisión no son cumplidos. Por ejemplo, un gato tiene normalmente cuatro patas y una cola, pero a un gato determinado le puede faltar la cola y una de sus patas; en este caso el algoritmo reconocedor (matcher) debe ser lo suficientemente inteligente para ser capaz de averiguar que el mejor marco de los posibles (best fit) es el del gato, aunque dos de sus principales características no se cumplan.

Fig4-20.gif

Herencia y reconocimiento de patrones en marcos


Para finalizar mostraremos algunas implementaciones de sistemas de marcos consideradas hoy en día clásicas: KRL, OWL y KL-ONE.

· El desarrollo de KRL (Knowledge Representation Language) estuvo inicialmente motivado por el procesamiento del lenguaje natural. Las unidades básicas que componen una base de datos KRL son los marcos. La información contenida en los slots contiene detalles sobre cómo instanciar un marco.

En su implementación hacen uso intensivo de los conceptos de prototipo y primitivos, que utilizan de un modo un tanto libre en esta primera exposición, pero definen mejor en otras posteriores.

Como su nombre indica, KRL, es a la vez un sistema de KR y un lenguaje de programación.

· OWL basa sus características en la sintaxis y semántica del inglés, tomando como principio la Hipótesis de que el idioma de un hablante juega un papel determinante en su modelo del mundo, y por tanto en la estructuración de su mente.

Una base de conocimiento de OWL puede ser vista como una red semántica cuyos nodos son expresiones que representan el significado de oraciones en lenguaje natural. Cada nodo, denominado "concepto", queda definido por un par, donde el "genus" especifica el tipo o "superconcepto" y el "specializer" distingue este concepto de todos los demás que comparten el mismo "genus".

· KL-ONE el más relevante en cuanto que a partir de él han surgido numerosos sistemas de KR que se están desarrollando o usando hoy en día. De hecho, se suele hacer referencia a los lenguajes de programación/representación basados en marcos mediante el calificativo "al estilo de KL-ONE".

Como viene siendo habitual, una taxonomía de KL-ONE comprende conceptos, con un número de propiedades atribuidas y una serie de relaciones entre conceptos. Más concretamente, un nodo (concepto) de KL-ONE consiste en un conjunto de roles (generalizaciones de las nociones de atributo, parte, constituyente, rasgo, etc.) y un conjunto de condiciones estructurales que expresan relaciones entre esos roles. Los conceptos están enlazados a conceptos más generales en una relación especial llamada SUPERC. El concepto más general en la taxonomía es denominado superconcepto, y subsume (es más general que) todos los demás.

Los conceptos y roles de KL-ONE tienen una estructura parecida a las clásicas nociones de registro y campo para las bases de datos, o de marco y slot en el ámbito en la terminología de la IA.

Spotlights de otras wikias
Solicita el tuyo aquí

Wiki aleatorio