El Thesaurus.

Elementos, construcción y mantenimiento.

Índice

 Introducción

 Definición

 Estructura del thesaurus

 Presentación formal de descriptores

 Presentación formal de palabras

 Métodos para evitar la ambigüedad

 Relaciones entre descriptores

 Elaboración de un thesaurus

 Establecimiento de una lista de descriptores candidatos

 Selección de descriptores

 Establecimiento de relaciones

 Presentación del thesurus

 Verificación y puesta al día

 Clases de thesaurus

 Principales thesaurus

 

 

Introducción.

Palabra procedente del latín y el griego, significa tesoro, depósito de riqueza y libro mágico. Se aplicó por primera vez por Roget en 1852 en su obra Thesaurus of English words..., aunque no con el mismo significado con el que se emplea en documentación: los anglosajones utilizan esta palabra para designar determinados libros, tales como diccionarios y obras que recopilan datos alfabéticamente. Con la acepción que hoy se utiliza, comenzó a emplearse en los años cincuenta, aunque el primer thesaurus con las características actuales en documentación fue publicado en 1960 por la Agencia de Servicios Técnicos de Información de la Armada (ASTIA), hoy Defence Documentation Center.

Subir

 

Definición.

Las normas ISO-AFNOR contemplan una doble definición del thesaurus, atendiendo a su función o a su estructura.

Desde el punto de vista de su estructura, el thesaurus es un vocabulario controlado y dinámico de términos que tienen entre sí relaciones semánticas y genéricas y que se aplica a un campo particular del conocimiento. Desde el punto de vista funcional, un thesaurus es un instrumento de control de la terminología, utilizado para trasladar a un lenguaje más estricto (lenguaje documental) el lenguaje natural utilizado en los documentos. Según García Gutiérrez, el thesurus es un lenguaje documental de estructura combinatoria, normalizado y normativo, de carácter especializado, que unifica terminológicamente los conceptos expresados en los documentos con el fin de permitir su análisis y recuperación.

Dado que se trata de un subgrupo estructurado del lenguaje natural, describe el contenido analítico de los documentos, de los objetos o del conjunto de datos. La terminología utilizada para describir las características formales del documento y que corresponde a términos no descriptores del contenido no tiene necesidad de formar parte de un thesaurus. Por otra parte, debe reflejar con precisión las informaciones contenidas en el conjunto de documentos u otros elementos de la colección a la que se aplica el thesaurus y contener los términos y reenvíos apropiados al tema, teniendo en cuenta a la vez el lenguaje de los documentos y el lenguaje de los usuarios. El thesaurus es un diccionario que muestra la equivalencia entre los términos del lenguaje natural y los normalizados y preferentes del lenguaje documental: en él quedan incluidos los términos descriptores y no descriptores, con las relaciones explícitas que faciliten el análisis del documento y la formulación de las necesidades del usuario. Participan, pues de la estructura jerárquica y de la asociativa.

Subir

 

 

Estructura del thesaurus.

El thesaurus está estructurado en los siguientes aspectos:

 Descriptores. Son los términos retenidos en un thesaurus con objeto de llevar a cabo la indización de documentos. Son términos o símbolos formalizados y homologados que se emplean para representar sin ambigüedad los conceptos retenidos en los documentos y en las consultas documentales. Pueden considerarse descriptores:

 los términos que representan conceptos.

 los términos que representan entidades individuales: nombres de proyectos, nomenclaturas, números o símbolos de identificación, nombres geográficos o geopolíticos, marcas de fábrica, nombres de personas u organismos, abreviaturas o siglas y otros nombres propios o asimilados como tales.

Los términos que representan conceptos no retenidos en la indización se llaman no descriptores. Los descriptores deben acompañarse de signos distintivos.

Subir

 

 Presentación formal de descriptores.

Un descriptor puede constar de una o varias palabras. Por regla general, debe reflejar la terminología del tema sin tener en cuenta el número de palabras necesarias para representar el concepto, pero en la medida de lo posible se debe intentar que queden representados por el menor número de palabras, y preferentemente una sola. Los descriptores compuestos siguen el orden natural de las palabras, sin inversión artificial del mismo. Puede ser útil incluir las formas inversas como no descriptores, unidos a ellos por relaciones de preferencia.

Subir

 

 Presentación formal de palabras.

Una vez decidido retener un término en el thesaurus, hay que verificar que éste exprese lo más exactamente posible el sentido deseado. Para ello hay que considerar los siguientes aspectos:

 Ortografía: se utilizará la ortografía más admitida, y en casos extremos, las diferentes versiones estarán acompañadas de referencias de unas a otras. Se hará igual con idiomas extranjeros: en caso de alfabetos distintos, se preferirá al que no imponga signos diacríticos.

 Forma sustantiva: el descriptor se presentará en forma sustantiva o equivalente.

 Número: la utilización del número se decidirá de acuerdo con el idioma del thesaurus (en inglés hay tendencia a poner los descriptores en plural)

 Adjetivos: hay casos en los que pueden utilizarse los adjetivos o formas sustantivadas.

 Abreviaturas y siglas: deben evitarse las abreviaturas y, en caso de utilizarlas, hacer los envíos correspondientes.

 Puntuación: se debe reducir el uso de los signos de puntuación.

Subir

 

Métodos para evitar la ambigüedad.

El mayor problema con el que se enfrenta un thesaurus es el de eliminar las situaciones de ambigüedad que presenta el lenguaje natural. Para ello se debe recurrir a diferentes sistemas.

 Homónimos. Se pondrán de manifiesto los diversos sentidos de los homónimos, y distinguirse unos de otros por medio de símbolos o términos cualificativos que formen parte de un descriptor, colocados entre paréntesis inmediatamente detrás del homónimo. Estos símbolos que precisan el sentido no son homónimos que puedan colocarse en otras partes del thesaurus: un homónimo y su cualificativo entre paréntesis forman juntos un descriptor completo.

 Notas de aplicación o indicadores de función. Explican brevemente la función a la que debe destinarse el descriptor. Deben escribirse con caracteres especiales y distinguirse de los cualificativos. Pueden servir para limitar la aplicación de un descriptor, dar el significado de abreviaturas y siglas, excluir un posible sentido del término, e indicar las fechas y cambios de adición. Acompañan al descriptor en la parte principal del thesaurus, pero no forman parte de dicho descriptor.

 Definiciones. El contenido semántico de un descriptor se indica principalmente por su relación con los demás términos del thesaurus, pero cuando subsiste una duda sobre su interpretación es necesario añadir una descripción precisando su contenido exacto, que puede acompañar al descriptor en la parte principal, pero no forma parte de él.

 Traducciones. A menudo resulta útil dar términos equivalentes en otros idiomas para asegurarse la utilización correcta del descriptor cuando se analizan textos en lenguas extranjeras.

Subir

 

Relaciones entre descriptores.

Una de las funciones principales del thesaurus es representar las relaciones entre los conceptos.Las relaciones son recíprocas, es decir, que cuando dos o más descriptores están relacionados entre sí, la indicación de esta relación se da para cada uno de ellos. Estas relaciones son;

 Relaciones de equivalencia. Los términos considerados equivalentes pueden reunirse en categorías de equivalencia de tal forma que los términos equivalentes correspondan a un solo e idéntico concepto. En la búsqueda documental deben poder encontrarse todos los términos equivalentes, aunque uno solo de ellos sea el descriptor. Se debe distinguir entre sinónimos (igual equivalencia) y cuasisinónimos (distinta equivalencia, pero con la posibilidad de ser utilizados como sinónimos). Existen para ello dos tipos de reenvío:

 Use (usar): debe utilizarse el término que viene a continuación.

 Use for (usar por): se utilizará el término que encabece la lista en vez de los que vienen a continuación.

 Relaciones jerárquicas. Expresan las relaciones de superioridad o subordinación entre los conceptos. Pueden ser de dos tipos:

 Relación genérica. El término genérico representa una categoría de conceptos en la que los términos específicos están siempre incluidos.

 Relación partitiva. El término superior designa un objeto o concepto cuyo término subordinado representa una parte.

La relación jerárquica se representa por los símbolos TA: término amplio (BT: broad term) y el reenvío inverso TE: término específico (NT: narrower term).

 Relaciones asociativas. Se emplean para cubrir otras relaciones diferentes a las jerárquicas o asociativas. Se utiliza el término VT (RT: related term), que indica que los términos que figuran a continuación guardan una relación con el que encabeza la lista. Se emplea para indicar conceptos antónimos, coordinación, relación genética, utilización de dos conceptos coexistentes, de causa a efecto, relación instrumental, relación material, formas de similitud, etc.

Subir

 

 

Elaboración de un thesaurus.

El primer paso para la elaboración de un thesaurus consiste en comprobar la existencia de otros thesaurus especializados en el mismo campo. En caso afirmativo, conviene verificar el idioma en que está redactado, para traducirlo antes de iniciar un nuevo thesaurus. En caso contrario, los pasos a dar para su elaboración son los siguientes:

 Subir

 

 Establecimiento de una lista de descriptores candidatos.

Elaboración de una lista de las palabras más utilizadas y significativas en el campo temático que cubra el thesaurus. No existe un método lingüístico riguroso, pero pueden emplearse dos métodos distintos para llevarlo a cabo:

 Método analítico. Consiste en establecer la lista básica partiendo del análisis previo de los documentos y de las preguntas de los usuarios. Exige una indización previa, experimental y sin uso de thesaurus. Es un método a posteriori.

 Método sintético. Las palabras clave no se seleccionan de los documentos, sino de las fuentes de referencia, diccionarios, índices de obras básicas, etc. Es un método a priori.

Subir

 

 Selección de descriptores.

Una vez establecidos los descriptores candidatos, deben seleccionarse los aceptados. Para ello se siguen unas normas básicas y otras convenidas para cada caso.

 Concepto de descriptor. Se aceptan como descriptores aquellos términos que sean la transcripción efectiva de un concepto único: debe poseer unidad semántica propia, independientemente de su complejidad lingüística.

 Descriptores compuestos o precoordinados. Cuando se encuentra un término candidato compuesto se cuestiona si puede descomponerse en elementos semánticos y expresarse por combinación de descriptores sin variar ni confundir el significado, o por el contrario expresa un concepto que no se puede descomponer. Se da este caso cuando las palabras, consideradas pos sí mismas, carecen de significado, o cuando descomponer el término pude darle un significado poco preciso.

Subir

 

 Establecimiento de relaciones.

Una vez seleccionados los descriptores, se procede a establecer las relaciones que puedan existir entre ellos, con el fin de eliminar ambigüedad que pueda inducir a error o dificultar la búsqueda documental. Estas relaciones son:

 Relaciones de sinonimia: cada concepto no puede ser transcrito más que por un solo descriptor. Se acepta el término más significativo.

 Relaciones jerárquicas: cada descriptor puede pertenecer a más de un campo temático; en este caso se expresan remitiendo de un término más específico a otro más amplio y viceversa.

 Relaciones asociativas: los descriptores pueden tener otros tipo de relaciones entre sí.

 Subir

 

 

Presentación del thesurus.

En primer lugar, es necesario en todo caso la existencia de una introducción que explique claramente el objetivo y la estructura del thesaurus. Debe indicar nombre del organismo autor, contexto y objetivos del thesaurus, campo que cubre, número de descriptores y no descriptores, método de elaboración, tipo de presentación, abreviaturas y tipografía utilizadas y forma de utilización del thesaurus y sus partes.

 

Los tipos de presentación del thesaurus son muy variadas. Las más comunes son la presentación alfabética, alfabética permutada, temática, jerárquica y gráfica. Generalmente coexisten varias presentaciones, dado que son complementarias, y se recomienda que cada una de estas partes contenga toda la información relativa a cada término, es decir, el conjunto de relaciones que correspondan al ámbito semántico del término.

 

 Presentación alfabética. Corresponde generalmente a la parte principal del thesaurus: a cada descriptor le siguen las indicaciones de las relaciones con los otros términos de acuerdo a este orden:

 Nota de aplicación

 Sinónimos

 Términos genéricos

 Términos específicos

 Términos asociados.

 

 Presentación alfabética permutada. Permite un acceso fácil a los descriptores compuestos, dado que agrupa a los términos alejados en una presentación alfabética no permutada. La permutación se realiza a partir de las palabras significativas de los términos simples o compuestos, descriptores, conjunto de descriptores y no descriptores.

 

 Presentación temática. Agrupación de los términos permitiendo un acceso al thesaurus según el campo temático.

 

 Presentación jerárquica. Aparecen los términos del thesaurus con sus relaciones genéricas-específicas. Se visualizan los diferentes niveles de la jerarquía mediante un descenso de los términos hacia la derecha (sangrado) o por una disposición arborescente.

 

 Presentación gráfica. Los descriptores se presentan en grupos semánticos. La presentación más corriente consiste en que cada grupo está dotado de una rejilla y cada descriptor se halla asignado a un lugar determinado de acuerdo con unas coordenadas verticales y horizontales. Las relaciones entre los descriptores se manifiestan por:

 Disposición gráfica (coordenadas, círculos concéntricos, etc.)

 Flechas entre descriptores

 Colocación en los márgenes.

 Indice alfabético. Es un complemento de la presentación no alfabética de los términos que facilita su acceso.

 Listados anexos. Pueden adjuntarse a un thesaurus (organismos, nombres geográficos, etc.) con el fin de facilitar su uso.

 Subir

 

 

Verificación y puesta al día.

En el proceso de elaboración de un thesaurus es necesario efectuar pruebas de su utilidad, de acuerdo a las necesidades de la función documental. Debe tenerse en cuenta:

 Si la estructura propuesta se aviene con las necesidades más recientes.

 Si sus descriptores son útiles para indización y búsqueda.

 Si las relaciones son correctas y suficientes.

 

Para verificar su utilidad debe consultarse con especialistas en el tema del thesurus, con documentalistas y con usuarios, y se debe tener en cuenta la continua evolución del lenguaje científico. Los nuevos conceptos que vayan surgiendo irán formando un thesaurus provisional que se comprobará continuamente, y se retendrán en función de su posible eficacia. Los términos aceptados se integrarán en posteriores ediciones del thesaurus. Según las normas ISO, la elaboración de un thesaurus no finaliza jamás.

 Subir

 

Clases de thesaurus.

Los thesaurus pueden clasificarse atendiendo a múltiples puntos de vista. Los más usuales son;

 Según su ámbito: institucionales, nacionales, internacionales.

 Según su contenido: megathesaurus, macrothesaurus, microthesaurus.

 Según su lengua: monolingües, bilingües, polilingües...

 Subir

 

 

Principales thesaurus.

Los thesaurus más conocidos son el de la UNESCO, con más de 8.000 descriptores, clasificación por facetas, thesaurus alfabético e índices permutados; el thesaurus Broad System Ordering, realizado por UNESCO y FID en el marco de UNISIST; el de la OCDE. En cuanto a los thesaurus especializados es preciso consultar la bibliografía de thesaurus de Laureilhé con los thesaurus aparecidos entre 1960 y 1974. Son modelos de ellos el del EURATOM y el del Departamento de Defensa USA.

 Subir

Volver a:

Zaguán

Libros, bibliotecas, bibliotecarios

Rosario López de Prado

rlp@man.es

Museo Arqueológico Nacional (BIBLIOTECA)

Última revisión: 6 de mayo de 2000