Tesauros, Mapas Conceptuales
y Topic Maps

Noemi Betancort Cabrera
Lidia Chozas Mahillo

Web de Noemi Betancort

Los Tesauros, los Mapas Conceptuales y los Topic Maps son el tema de esta página web, que es de gran interés en Documentación y está en estrecha relación con las Ontologías. Hacemos hincapié en los tesauros, proporcionando una breve aproximación a la tarea de construcción de vocabularios controlados y haciendo una revisión de los principales métodos de confección.

  1. Tesauros
  2. Mapas Conceptuales
  3. Topic Maps
  4. Enlaces

Tesauros

Etimológicamente viene del latín y su significación era tesoro. Es una definición que tiene poco que ver con el concepto que tiene hoy para un documentalista, así la norma ISO 2788 / TC 46 nos dice que los tesauros se pueden definir según su función y según su estructura:

Por su función, como un instrumento de control terminológico utilizado para trasponer a un lenguaje más estricto el idioma natural empleado en los documentos y por los indicadores.

Por su estructura, es un vocabulario controlado y dinámico de términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento.

Arriba

Los tesauros tienen como finalidad minimizar los inconvenientes que plantea el lenguaje natural en la recuperación de información. Al igual que los mapas conceptuales, se aplican como herramientas para la organización del vocabulario de un determinado ámbito científico. Contribuyen a dar coherencia a la indización, y su lenguaje es controlado en función de las necesidades y la materia.

El tesauro constituye una herramienta que facilita al usuario la comprensión del contexto de interpretación del concepto, en especial en la fase de búsqueda.

El tesauro representa, por un lado, la estructura de los conocimientos transmitidos por los creadores de la información, y, por otro lado, la estructura cognitiva de los usuarios que formulan la expresión de búsqueda.

En los tesauros, los descriptores, representan conceptos o nociones que pueden ser concretas, abstractas, entidades individuales o clases. Para expresar los conceptos, los tesauros contienen unidades léxicas llamadas descriptores y no descriptores.

Arriba

En cuanto a la tipología, pueden concebirse desde dos enfoques:

Por facetas, que según la norma ISO 2788 sobre la construcción de tesauros monolingües, es una noción más abstracta que el concepto de campo, lo cual requiere una disciplina mental más rigurosa para el compilador. Los documentos de agrupan por clase o puntos de vista, según un tipo básico de conceptos.

Por campos, que pone en relación los conceptos con los cuales generalmente se asocia un concepto.


Las relaciones que hay entre los términos de un tesauro son:

Relaciones de equivalencia: es la relación entre descriptores o términos preferidos y los no descriptores o términos no usados en la indización referentes a un mismo concepto. Se suelen considerar términos preferidos aquellos que más corrientemente son utilizados por los usuarios. Esta relación cubre dos tipos de términos los sinónimos y los cuasi-sinónimos. Los sinónimos son términos cuyo significado puede considerarse igual, por lo que son intercambiables y, tienen diferente origen lingüístico. Los cuasi-sinónimos son términos cuyo significado es considerado diferente en el uso común, pero son tratados como sinónimos en la indización.

Relaciones jerárquicas: es la relación vertical entre todos los descriptores de una misma clase, expresada en términos de subordinación de los conceptos. Estas relaciones se utilizan durante la búsqueda para enriquecer la formulación de la pregunta, añadiendo a la búsqueda uno o más descriptores superiores o inferiores para concretar la búsqueda.

Relaciones asociativas: indican relación o uniones en la significación de los descriptores. Son relaciones simétricas entre dos descriptores, que son susceptibles de evocarse mutuamente por asociación de ideas. Las relaciones asociativas son las más difíciles de definir y es la categoría que ha recibido más críticas ya que, a pesar de las directrices que regulan su interpretación, su atribución suele fundarse en un análisis intuitivo que expresa el punto de vista de quien la establece.

Arriba

En cuanto a la elaboración de un tesauro, (de lo que hablaremos en profundidad en el siguiente apartado) es una operación intelectual, en la cual la automatización sólo puede aportar una ayuda para las tareas de carácter más rutinario y repetitivo. Su elaboración supone el trabajo continuo de un grupo de especialistas en la materia durante un período de tiempo bastante amplio, que dependerá del volumen del tesauro, de los campos a cubrir y de la profundidad de la indización.


Para la compilación existen dos métodos:

Inductivo: parte de cierto número de términos de los dominios considerados a través de enciclopedias, diccionarios técnicos, índices bibliográficos...

Deductivo: cuyo vocabulario se extrae de los documentos, por indización libre de cierto número de documentos, mediante el recuento de la frecuencia de aparición.


Ambos métodos se utilizan conjuntamente, existiendo siempre una normalización, aunque sea mínima con preferencia por la forma singular, masculina, forma sustantiva, escritura directa.

Obteniendo el vocabulario se procederá a su reducción por la eliminación de los términos no significativos y, el establecimiento de las relaciones entre los descriptores y entre estos y los no descriptores.

Una vez concluido el vocabulario se procederá a la evaluación del mismo. Con lo cual se procederá a su edición. Pero el tesauro no es algo definitivo y absoluto, este se debe ajustar a los progresos y a los propios usuarios y cambios en el sistema, por lo que cuando sea necesario debemos de recurrir a su mantenimiento, por medio de estadísticas de utilización de los descriptores.

Arriba

En cuanto a la presentación del tesauro hay varias:

Presentación alfabética: los descriptores y no descriptores se encuentran agrupados en una sola secuencia alfabética, acompañado de sus relaciones. No es la forma más habitual de encontrarlos.

Presentación sistemática: consta de dos partes, una de ellas son las categorías o jerarquías y por otra un índice alfabético, que dirige a los usuarios a la sección semántica a la que el concepto pertenece. Considerándose esta última sección la parte principal del tesauro y el índice como auxiliar.

Presentación gráfica: dispuestos como una figura que permite al usuario asociar los términos que se encuentran relacionados. Con dos tipos de presentación, los árboles y los flechados. También debe de constar de un índice alfabético, pues es difícil representar los no descriptores, notas de alcance. Dándose el caso de que la sección auxiliar del índice contiene más información que la parte en teoría principal, siendo esta gráfica de apoyo.


Podemos mostrar un ejemplo, extraído del tesauro INSPEC (cuyo dominio es la física, las ingenierías eléctricas, electrónica, así como ordenadores y control) El tesauro está organizado lógicamente como un set de jerarquías. Además de esta disposición jerárquica, el tesauro INSPEC impreso también incluye un listado alfabético con los términos del tesauro. Cada jerarquía está construida desde un término raíz que representa el mayor nivel conceptual en el dominio. En el ejemplo "computer-aided instruction" es una parte de la jerarquía cuya raíz o top term (TT) es "computer applications". El "see also" guía hacia los términos del tesauro del mismo nivel. NT sugiere un término más específico; similarmente, BT proporciona un término ma´s general. RT significa un término relacionado y esta relación incluye un variedad de enlaces tal como parte-todo y objeto-propiedad. UF es utilizado para indicar la forma elegida de un set de alternativas. En el ejemplo, "computer-aided instruction" es usado por la alternativa "teaching machines". Lo contrario es USE, que lleva al usuario de una forma que nos es parte del vocabulario hacia una alternativa válida. El ejemplo muestra que "caesium" es la forma preferida a "cesium". CC y FC provienen del esquema de clasificación de INSPEC e indican el área temática en que el término es usado.

Cesium
USE caesium

Computer-aided instruction
See also education
UF teaching machines
BT educational computing
TT computer applications
RT education
Teaching
CC C7810C
FC c7810Cf

(A short extract from the 1979 INSPEC thesaurus)

Arriba

Características de los Tesauros

Podríamos resaltar las siguientes características en un tesauro:

Nivel de coordinación: la coordinación se refiere a la construcción de frases desde términos individuales. Se pueden distinguir dos tipos de coordinación en el tesauro: precoordinación y postcoordinación. Un tesauro precoordinado es uno que puede contener frases. Así, las frases están disponibles tanto para la indización y la recuperación. Un tesauro postcoordinado no permite frases. De esta forma, las frases son construidas mientras se está buscando.

La ventaja de la precoordinación es que el vocabulario es muy preciso, así reduce la ambigüedad en la indización y en la búsqueda. También, las frases comúnmente aceptadAs se vuelven parte del vocabulario. Sin embargo, la desventaja es que el usuario tiene que ser consciente de las reglas de construcción de frases empleadas. El tesauro puede adoptar un nivel intermedio de coordinación permitiendo frases y palabras únicas a la vez. Esto es típico en tesauros construidos manualmente. Sin embargo, dentro de estos pueden darse grandes diferencias (algunos enfatizan en frases de dos o tres palabras mientras que otros, en frases de tamaño mayor)

El nivel de coordinación es importante también. Podría reconocerse que el mayor nivel de coordinación, la mayor precisión del vocabulario viene aparejado al mayor tamaño del tesauro. Esto también implica un incremento en el número de relaciones que son codificadas. Por lo tanto, el tesauro se vuelve más complejo.

La ventaja de la postcoordinación es que el usuario no necesita preocuparse del orden exacto de las palabras en la frase. Las combinaciones de frases pueden ser creados como y cuando sea apropiado durante la búsqueda. La desventaja es que la precisión de la búsqueda puede caer, como se refleja en el siguiente ejemplo, de Salton y McGill (1983): la distinción entre frases tal como "Venetian blind" y "blind Venetian" puede perderse. Un ejemplo más claro se ve en "library school" y "school library". Así, a menos que la estrategia sea construida cuidadosamente, ítems irrelevantes podrán ser recuperados.

La precoordinación es más común en los tesauros construidos manualmente. La construcción automática de frases es todavía muy difícil y por lo tanto la construcción automática de tesauros usualmente implica postcoordinación.

Arriba

Relaciones entre términos: son el aspecto más importante de los tesauros ya que las conexiones entre el vocabulario que proporcionan son más valiosas para la recuperación. Muchas clases de relaciones son expresadas en tesauros manuales. Son semánticas en naturaleza y refleja las conexiones conceptuales entre los términos.

Existen relaciones de equivalencia (sinónimos y cuasisinónimos à "genetics" y "heredity") Un ejemplo típico de jerarquía es especie-raza, tal como "dog" y "german shepherd". Las relaciones no jerárquicas también identifican términos relacionados conceptualmente. Tal como cosa-parte reflejado en "bus" y "asiento"; cosa-atributo tal como "rosa" y "fragancia"

La mayoría de estas relaciones son difíciles de identificar por métodos automáticos, especialmente por algoritmos que explotan solo las relaciones estadísticas entre términos que se extraen de las colecciones de documentos.

Arriba

Número de entradas para cada término: en general es preferible tener una entrada única para cada término del tesauro. Sin embargo, esto no se logra del todo debido a la presencia de homógrafos -palabras con múltiples significados. La semántica de cada homógrafo puede ser descifrado solamente mediante el contexto. Sin embargo es mejor tener una única representación o entrada por cada significado de un homógrafo. Esto también permite que cada entrada homográfica sea asociada con su propio set de relaciones. El problema se puede solucionar especificando entre paréntesis, al lado de la palabra, su orientación. Bonds (chemical) y bonds (adhesive).


Especificidad del vocabulario: la especificidad del vocabulario del tesauro es una característica derivada de los términos que lo componen. Un vocabulario específico es capaz de expresar el tema con gran profundidad y detalle. Esto permite precisión en la recuperación. La desventaja es que el tamaño del vocabulario crece hasta un largo número de términos que son requeridos para cubrir los conceptos de un dominio.

Arriba

Control de la frecuencia de los términos de cada clase: esto tiene relevancia principalmente cuando se utilizan los métodos estadísticos para la construcción de un tesauro, que trabajan mediante la partición del vocabulario en un set de clases donde cada clase contiene una colección de términos equivalentes. Es necesario asegurar que los términos incluidos en la misma clase del tesauro tenga la misma frecuencia. La frecuencia total en cada clase debería ser similar (cuenta: el número de ocurrencias de términos en la colección de documentos; el número de documentos en la colección en que el término aparece por lo menos una vez).


Normalización del vocabulario: la normalización de los términos tiene un mayor énfasis en tesauros manuales. Hay extensas reglas que guían la forma de las entradas de un tesauro. Una regla simple es que los términos deberían estar en forma sustantiva. Una segunda regla es que las frases sustantivas deberían evitar preposiciones a menos que sean comúnmente conocidos. También, un número limitado de adjetivos debería ser usado. Esto da consistencia al vocabulario. El usuario no debe preocuparse sobre las variantes de un término. La desventaja es que, para ser usado efectivamente, el usuario tiene que ser consciente de la normalización de las reglas usadas.

Arriba

Construir un Tesauro

El proceso de la construcción manual de un tesauro es tanto un arte como una ciencia. Lo primero que hay que hacer es definir los límites del área temática. (En la construcción automática, este paso es simple, donde los límites se toman como el área cubierta por la base de datos) La definición de los límites incluye la identificación de las áreas temáticas centrales y las periféricas ya que es improbable que todos los topics incluidos sean de igual importancia. Una vez que esto es completado, el dominio generalmente es dividido en subdivisiones o subáreas. Una vez que el dominio, con sus subareas, ha sido definido suficientemente, las características deseadas del tesauro tienen que ser definidas. Como el tesauro manual es más complejo estructuralmente que los automáticos, hay más decisiones que tomar.

Ahora, la colección de términos para cada subárea puede empezar. Una variedad de fuentes pueden ser usadas para esto, incluyendo índices, enciclopedias, manuales, libros de texto, títulos de artículos y resúmenes, catálogos, así como cualquier tesauro o sistema de vocabulario existente y relevante.

Los expertos temáticos y los usuarios potenciales del tesauro deberían también estar incluidos en este paso. Después de que el vocabulario inicial ha sido identificado, cada término es analizado por su vocabulario relacionado, incluyendo sinónimos, términos genéricos y específicos, y a veces también definiciones y notas de alcance. Estos términos y sus relaciones luego son organizados en estructuras tal como jerarquías, en cada subárea.

Arriba

El proceso de organización del vocabulario puede revelar deficiencias que pueden orientar la adición de términos; identificar las necesidades de nuevos niveles en las jerarquías; reunir sinónimos que no fueron reconocidos previamente; sugerir nuevos relaciones entre términos; reducir el tamaño del vocabulario.

Una vez que la organización inicial ha sido completada, el tesauro entero deberá ser revisado (y refinado) para comprobar la consistencia tanto en las formas de las frases como de las palabras. Los problemas surgen de la incorporación de términos de tesauros existentes que pueden por ejemplo, tener diferentes formatos y reglas de construcción.

En este punto, el tesauro estructurado jerárquicamente tiene que ser invertido para producir un listado alfabético de las entradas -una lista más efectiva para las búsquedas. Típicamente tanto la disposición alfabética como la jerárquica son proporcionadas en el tesauro. A continuación, el tesauro generado manualmente está preparado para ser examinado por expertos del tema y editado para incorporar sus sugerencias.

Esta descripción informal está muy incompleta. Es un largo proceso que implica a un grupo de individuos y una variedad de recursos. Una vez que el tesauro ha sido diseñado e implementado para usarse en un sistema de recuperación, el siguiente problema es que necesita ser mantenido para asegurar su validez y efectividad continua. Esto es, el tesauro debería reflejar cualquier cambio en la terminología del área. El problema es que mientras los viejos documentos están todavía en el sistema, el tesauro actualizado debe conservar también la información antigua. Las actualizaciones son lentas y de nuevo implican muchos individuos que revisan regularmente y sugieren nuevos y modificados términos del vocabulario así como relaciones. Por lo tanto, un tesauro típico se desarrolla con tiempo y lentamente, respondiendo a los cambios en la terminología de la materia.

Arriba

Construcción automática de tesauros

Usa técnicas puramente estadísticas (la alternativa es usar métodos lingüísticos) Consecuentemente, los dos métodos seleccionados aquí no han recibido necesariamente la misma atención en la literatura. La primera, que implica el diseño de tesauros mediante colecciones de documentos, es una forma muy recurrida. La segunda, de la unión de tesauros existentes, es más conocido en tesauros construidos manualmente.

También se distingue un tercer método que es novedoso e interesante, aunque está basado en herramientas de sistemas expertos y no usa métodos estadísticos; estos tesauros se construyen usando información obtenida de los usuarios.

Arriba

A partir de una Colección de Documentos

La idea es usar una colección de documentos como la fuente de la construcción del tesauro. Se asume la idea de que un cuerpo representativo de texto está disponible. La idea es aplicar procedimientos estadísticos para identificar los términos importantes así como sus relaciones significativas.

Se reitera aquí que la tesis central en la aplicación de métodos estadísticos es usar métodos informáticos simples para identificar la semántica más importante del tesauro. Es conocimiento semántico que es usado tanto por indizadores como por buscadores. Hasta que sean descubiertos métodos más directos, los estadísticos continuarán siendo usados. El trabajo de Soergel (1974) es relevante en este punto puesto que incluye una discusión interesante sobre las variadas interpretaciones semánticas que surgen de las asociaciones estadísticas significativas entre las palabras.

El proceso puede dividirse en tres etapas:

Construcción del vocabulario: esto incluye la normalización y selección de términos; también la construcción de frases dependiendo del nivel de coordinación deseado.

cálculo de semejanzas entre los términos: este paso identifica las asociaciones estadísticas significativas entre los términos.

Organización del vocabulario: el vocabulario es organizado, generalmente en jerarquía, partiendo de las asociaciones calculadas en el paso 2.

Arriba

A partir de la mezcla de Tesauros existentes

Este segundo método es apropiado cuando dos o más tesauros para un área dada existen y necesitan ser unidos en una única unidad. Si una nueva base de datos puede servirse mediante la unión de dos o más tesauros existentes, una unión quizá es más que suficiente.

Este método ha sido discutido en profundidad por Forsyth y Rada (1986). El desafío es que la unión no debería violar la integridad de cualquier tesauro compuesto. Rada ha experimentado con el aumento del tesauro MeSH (Medical Subject Headings) usado en MEDLINE con los términos seleccionados del SNOMED (Systematized Nomenclature of Medicine) desarrolado por el College of American Pathologists.

Arriba

Tesauro generado a partir de los Usuarios

La idea es que los usuarios del SRI usen muchas relaciones de términos en sus estrategias de búsqueda mucho antes de que encuentren la forma en el tesauro. El objetivo es capturar este conocimiento de la búsqueda del usuario. Esta es la base de TEGEN (el sistema de generación de tesauros diseñado por Guntzer et al. en 1988)

Ellos propusieron TEGEN como una alternativa válida para la construcción automática de tesauros. El procedimiento implica examinar los tipos de operadores booleanos usados entre los términos de búsqueda, el tipo de modificación de la interrogación ejecutada por el usuario, y más.

El feedback del usuario es incluido para resolver cualquier ambigüedad e incertidumbre. El feedback también se requiere para seleccionar el tipo específico de relación entre dos términos una vez que se ha decidido que los términos están relacionados. Por lo tanto, su método requiere una considerable interacción con la población usuaria. TEGEN es diseñado usando reglas de producción que realizan un análisis detallado de los patrones de búsqueda del usuario. Este método utiliza principalmente metodologías de sistemas expertos.

Arriba

Mapas Conceptuales

Los mapas conceptuales aparecen en el ámbito de la didáctica de las disciplinas científicas en 1984 por Novak. Él propone el uso de una herramienta que llama concept map y que define como "un dispositivo esquemático que representa un conjunto de significados conceptuales incluidos en una estructura de proposiciones". Para Novak los mapas conceptuales no se deben considerar herramientas para el aprendizaje, sino un medio para desarrollar las actividades y rutinas necesarias para que este se produzca.

La evaluación del mapa depende de su riqueza y de su organización, las cuales se derivan del número de proposiciones consideradas, el número y la validez de los enlaces establecidos entre los conceptos, el grado de profundidad alcanzado por la organización.

Estos mapas son considerados por Novak como auténticas herramientas metacognitivas, que permiten visualizar la articulación de los conceptos y expresar los elementos conocidos acerca de un tópico para, a partir de ahí, desarrollar estrategias de profundización.

Los mapas conceptuales no aplican ningún control de vocabulario. Para su construcción no existe ninguna normalización.

Los mapas conceptuales pueden responder a una organización jerárquica o no jerárquica, con enlaces únicos o múltiples, dispuestos en forma de tela de araña o de círculos concéntricos, etc.

Arriba

Novak, indica que el mapa conceptual contiene 3 elementos fundamentales:

Concepto: las imágenes mentales que provocan en nosotros las palabras o signos con los que expresamos regularidades. Hacen referencia a acontecimientos u objetos. Los conceptos se ponen como nodos en los mapas conceptuales.

Proposición: Dos o más conceptos unidos por palabras-enlace para formar una unidad semántica.

Palabras-enlace: Las palabras que sirven para unir los conceptos y señalar el tipo de relación existente entre ambos conceptos. Las palabras -enlace se anotan en las líneas que unen a dos nodos.

Arriba

Hay tres características que diferencian los mapas conceptuales de otros recursos gráficos:

Jerarquización: Los conceptos están dispuestos por orden de importancia o de "inclusividad". Solo aparece una vez un mismo concepto. Las líneas de enlace pueden terminar en una flecha para indicar el concepto derivado.

Selección: Son una síntesis o resumen que contienen lo más significativo de un tema. Se pueden elaborar sub-mapas, que vayan ampliando diferentes partes o subtemas del tema principal.

Impacto Visual: "Un buen mapa conceptual es conciso y muestra las relaciones entre las ideas principales de un modo simple y vistoso, aprovechando la notable capacidad humana para la representación visual."

Arriba

Topic Maps

El Topic Map tiene su origen en el grupo de Davenport, un foro destinado a productores de libros electrónicos que surgió a principios de la década de los 90. En 1993 se propuso la creación de una norma cuyo principal objetivo fuera posibilitar la fusión de índices impresos. Posteriormente evolucionó hacia otras estructuras (como tesauros), hasta llegar a ser una herramienta considerada en la web para la organización, representación y gestión del conocimiento. La primera versión oficial del estándar ISO/IEC data del año 2000.

En la práctica, la implementación de los topic map se diseñó para arquitectura SGML con notación de HyTime, la DTD del estándar ISO/IEC 13250:2000 se ha mantenido en HyTime. No obstante, esta notación ha caído en desuso tras la aparición de XML. En este caso, las causas del desplazamiento de la notación de HyTime se deben a la creación de una DTD para crear topic maps en XML, denominada XTM, y al auge que ha obtenido XML. En cualquier caso, actualmente se pueden encontrar ejemplos de ambos lenguajes en la Web.

El estándar Topic Maps está definido para SGML, y un topic map es un documento o un conjunto de documentos SGML o XML, interrelacionados en un espacio multidimensional en el que las localizaciones son topic. Pero desde el punto de vista conceptual, la noción madre de todo el Paradigma topic es la de subject.

Arriba

Los conceptos clave que forman un topic map son: topic, topic type, topic ocurrence, ocurrence role, topic association, association type, theme/scope, public subject y facet.

Un topic es la representación en el topic map de un concepto abstraído de una realidad cualquiera. La abstracción puede ser individual, es decir puede referirse a sujetos particulares o puede hacer referencia a sujetos generales. Un topic es, en definitiva, la representación de cualquier constructo mental susceptible de definición y caracterización, que sirva para ir completando el subject madre que da origen a todos los "conceptos menores" representados en cada topic.

Un topic type representa la relación que se establece entre una clase y sus instancias, que son los topics. Por ejemplo, un topic type podría ser "país" y sus instancias "España", "Inglaterra", "Francia",etc. Los topics typpes varían en función del tipo de información con la que se esté tratando. Aunque los topics sean considerados como instancias de los topics types, éstos a su vez pueden ser considerados como topics. Así un topic puede ser "Madrid" y también puede serlo "ciudad", sin que esto impida que, al mismo tiempo, "Madrid" sea una instancia del topic type "ciudad".

Las occurrences son los casos relevantes, o ejemplos significativos de un topic y suelen estar fuera del documento, o documentos, que se toma como referente del topic map que está siendo considerado. En sentido estricto son los links a otros recursos informativos en los que aparecen los ejemplos citados, y que, aunque ajenos al topic map, mejoran la comprensión de un topic. Así, los topics y sus occurrences se sitúan a dos niveles distintos. Igual que en el caso de los names, un topic puede estar enlazado (link) a una o más ocurrencias.

Arriba

Las occurrences se pueden agrupar en occurrences role. Las occurrences pueden ser de distintos tipos en función del recurso al que se enlace, es decir, pueden ser páginas web, artículos, monografías, comentarios, etc., y a esto es a lo que se le conoce como occurrences role.

La topic association es la relación que se establece entre topics. Es un elemento que enuncia la relación entre dos o más topics. Las topics association están compuestas por dos o más topics y por las formas verbales que los une.

Las topics association se pueden clasificar según la association type. La association type está definida por la forma verbal que une a los topics, es decir, la association type es la que define el verbo que une en cada caso a los topics. Ejemplos como "nació en", "escrito por", "pertenecer a". Todos estos casos distintos constituyen, a su vez, los diferentes association types. Cada una de las association types puede ser interpretada también como un topic. La association role es el papel/función desempeñado por cada uno de los topics que participa en una asociación concreta. Por ejemplo, en "nació en" podríamos decir que los dos topics que une, deben ser la association role /.

El scope lo constituyen los límites de validez de las características asignadas a un topic. El límite de la validez de las asignaciones de cada topic se expresa mediante el conjunto de temas (theme) en los que las asignaciones tengan lugar. Un ejemplo podría ser "blanco" en el tema "financieo" o en el tema "pesca".

Arriba

Algunas veces el mismo constructo es representado por más de un topic link. Esto ocurre cuando se mezclan dos topics maps (por ejemplo, "France" y "Francia" pueden ser dos topics distintos que en realidad representan el mismo subject). En estos casos hay que tener alguna forma para establecer la identidad entre topics aparentemente diferentes.

El concepto que posibilita esta identidad es el de public subject, y el mecanismo usado es un atributo (el identity attribute) en el elemento topic. Estos atributos se dirigen a un recurso o fuente electrónico que identifica al subject e cuestión de la manera menos ambigua posible. Esta fuente puede ser oficial, un documento validable públicamente (por ejemplo una norma ISO) o puede ser simplemente una definición descriptiva dentro (o fuera) de uno de los topic map considerados.

Las facets proporcionan un mecanismo para asignar pares de property - value de recursos o fuentes de información. Una facet es simplemente una propiedad, y sus valores son denominados facet values. Las facets son usadas normalmente para suplir la clase de metadatos que pueden ser provistos por atributos SGML o XML. Pueden incluir propiedades como "lenguaje", "seguridad", aplicabilidad", etc. Las facets pueden ser usadas también para cubrir las clases de propiedades usadas en los sistemas de clasificación facetada. Por último, las facets constituyen un complemento al scope, mientras que el scope puede ser visto como un mecanismo de filtrado que está basado en las propiedades de los topics, las facets proporcionan un filtro basado en las propiedades de las fuentes de información mismas. Las facets son ortogonales al modelo del topic maps mismo (excepto cuando facets y facets values son vistos como topics).

El concepto más interesante de resaltar en el topic map es el de association type. Un topic map no establece un número concreto y cerrado de tipos posibles de relación, sino que deja abierta la posibilidad de establecer un número potencialmente infinito de tipos de relaciones.

Arriba

Las ventajas que tiene topic map para representar la web semántica se pueden resumir en:

Las posibles desventajas residen más en la poca madurez del estándar que en otros aspectos. Así se han revisado distintos aspectos, como:

Arriba

Enlaces

A continuación mostramos una serie de enlaces de interés, para los que quieran seguir profundizando sobre el tema:

Sobre Tesauros

http://web.usal.es/~alar/Bibweb/Temario/Tesauro.PDF
Página sobre el concepto, elaboración, y mantenimiento de tesauros.


Sobre Mapas Conceptuales

http://www.oocities.org/Area51/Stargate/4295/demc/b3.html
Breve página que contiene información interesante sobre mapas conceptuales.

http://www.conceptmaps.it/default-esp.htm
Relación entre los mapas conceptuales y el knowledge manager.

http://www.mapasconceptuales.com
Página sobre mapas conceptuales de navegación.


Sobre Topic Maps

http://www.topicmaps.org
TopicMaps.Org es un consorcio para el desarrollo de estas herramientas, con información también sobre XML.

http://www.fundacion.uc3m.es/jotri2003/ponencias/mapas.pdf
Artículo de José Antonio Moreiro et al. en el que se tratan estos tres conceptos en profundidad, haciendo más hincapié en los Topic Maps.

Arriba


Página web que proporciona conocimientos básicos sobre los tesauros y su construcción así como sobre otras áreas próximas, como mapas conceptuales y topic maps. Elaborada por Lidia Chozas Mahillo y Noemi Betancort Cabrera.

Tesauros y su construcción, mapas conceptuales y topic maps

Esta página cumple con las normas de accesibilidad según TAW