Lenguajes documentales.

Índice

 Introducción

 Los lenguajes documentales

 El diálogo documental

 Tipología de lenguajes documentales

 Lenguajes documentales según la coordinación de sus términos

 Lenguajes documentales según su control terminológico

 Lenguajes documentales según su estructura

 Lenguajes documentales según su nivel de análisis

 El Thesaurus

 El ordenador y los lenguajes documentales

Introducción.

Se llama lingüística documental a la disciplina que se ocupa de los procesos informativos a través del establecimiento efectivo de un control documental mediante la utilización de mecanismos léxicos.

Subir

 

 

Los lenguajes documentales.

El lenguaje documental es el conjunto normalizado y normativo de términos relacionados por principios comunes y declarados portavoces preferenciales de los mensajes contenidos en el colectivo documental con el fin de provocar una recuperación pertinente de la información que este colectivo contiene. También puede definirse como el conjunto de términos o frases nominales utilizados para representar el contenido de un documento con el fin de permitir su recuperación (Amat, 1989). Para Courier, son lenguajes artificiales que permiten generar la representación formalizada de documentos y demandas.

Así pues, los lenguajes documentales son artificiales; proceden del análisis documental e influyen sobre él -normalizan y son normalizados-; y permiten la comunicación entre el usuario y la información, dirigiéndolo hacia el documento pertinente.

Subir

 

 

El diálogo documental.

El diálogo documental es la relación que se establece entre el usuario, que demanda una información, y el documento que la contiene, a través de las estrategias de búsqueda.

El emisor del mensaje (investigador, autor del texto), elabora un documento primario en lenguaje natural; por su parte, el receptor (usuario) demanda la información contenida en el documento, también en lenguaje natural, que por su variedad y extensión, puede no coincidir con el del documento. El puente de comunicación entre ambos es el lenguaje documental, utilizado por el documentalista para la creación de documentos secundarios que faciliten la búsqueda y permitan la recuperación de la información.

Subir

 

 

Tipología de lenguajes documentales.

Existen varias divisiones de lenguajes documentales que no son excluyentes entre sí. En términos generales, se pueden clasificar atendiendo a la coordinación de sus términos, a su control terminológico, a su estructura y al nivel de análisis que permiten.

Subir

 Lenguajes documentales según la coordinación de sus términos.

 Lenguajes precoordinados. Son aquellos que coordinan los diferentes conceptos que forman un tema antes de memorizar el documento. Se trata, principalmente de los lenguajes utilizados en bibliotecas: sistemas de clasificación y listas de materias. Permite pocos términos de indización por documento, pero proporciona en una sola búsqueda los elementos esenciales de información.

 Lenguajes postcoordinados. Permiten yuxtaponer los conceptos en el momento del análisis, de manera que se puedan coordinar después del almacenamiento. Los lenguajes postcoordinados precisan la utilización de ficheros suplementarios llamados ficheros inversos, que permitan encontrar los documentos que respondan a distintos conceptos, y que pueden estar confeccionados de distintos modos: ficheros UNITERM, sistema ZATOR, discos magnéticos, etc. Permite utilizar un gran número de vías de acceso al documento, pero teniendo como intermediarios ficheros especiales que necesitan una búsqueda en dos tiempos: identificación de documentos pertinentes y su localización.

Subir

 

 Lenguajes documentales según su control terminológico.

 Lenguajes controlados a priori. Se llaman así cuando se establece una lista de descriptores antes de proceder al análisis documental. Esta lista se encuentra cerrada y es nominativa: define todos los términos y únicamente los términos que se pueden utilizar para representar el contenido de los documentos (clasificaciones, listas alfabéticas de materias, thesaurus...). Exige una inversión inicial importante y necesita una puesta al día constante: sin embargo, la recuperación es rápida y eficaz.

 Lenguaje libre. No se definen a priori las listas de términos autorizados: basta con extraer de los documentos los términos más apropiados. En realidad, la negación absoluta de todo control es muy rara y absurda: aún teniendo en cuenta la no existencia de una lista de descriptores, el analista suele tener algunas reglas de control de los términos elegidos: uso del singular, términos no ambiguos, etc. El lenguaje libre no precisa inversión inicial ni puesta al día, pero la búsqueda es más lenta y menos eficaz.

Subir

 

 Lenguajes documentales según su estructura.

Los lenguajes documentales pueden estructurarse de forma jerárquica o asociativa: sin embargo, estos dos tipos de lenguaje no son contrarios ni opuestos, ya que ambos pueden modularse y complementarse según las necesidades de la indización documental.

 Lenguajes documentales de estructura jerárquica o clasificatoria. Sigue un orden lógico que agrupa y aproxima los conceptos más sencillos y específicos dentro de los más generales, lo cual lleva al establecimiento de una clasificación sistemática donde dichos conceptos se encuentran ordenados según una jerarquía natural. Cada concepto se halla representado por un símbolo (numérico, alfabético, alfanumérico, etc.). Las jerarquías son inamovibles, no tienen flexibilidad. Estos tipos de lenguajes se dividen en:

 Clasificaciones enciclopédicas: permiten la organización de documentos que traten sobre cualquier materia; son de ámbito universal y multidisciplinario. Sus inconvenientes son la rigidez, que dificulta su puesta al día y los límites que presentan para la descripción profunda (C.D.U., C.D.D., L.C.C., Clasificación Internacional de Patentes, etc.).

 Clasificaciones especializadas: abarcan disciplinas especializadas que no quedarían suficientemente representadas en una estructura jerárquica de orden multidisciplinar. La mayoría de bases de datos disponen de clasificaciones especializadas propias.

 Clasificaciones por facetas. De origen enciclopédico, su organización permite construir áreas concretas del conocimiento. Faceta es cada uno de los aspectos o puntos de vista que pueden interesar a un área concreta. Las más conocidas son las de Vickery y la C.C. de Ranganathan.

 Lenguajes documentales de estructura asociativa. Las nociones se expresan mediante listas alfabéticas en términos que expresan los conceptos retenidos durante la indización. Los términos se combinan libremente entre sí según las necesidades de los documentos, sin quedar sujetos a una posición determinada en el lenguaje. Proporciona un acceso más inmediato a la información, pero tiende a dispersar los términos parecidos: los conceptos se organizan desligados unos de otros y sólo se interseccionan en las operaciones de indización. Pertenecen a esta estructura los léxicos documentales y participan de ella, así como de la jerárquica, los thesaurus. Los léxicos documentales son vocabularios de términos controlados ordenados alfabéticamente siguiendo unas características especiales que los distinguen a unos de otros.

 Léxico alfabético de materias: Se organizan alfabetizando encabezamientos de palabras o grupos de palabras que expresen un concepto. Tienen como requisito la uniformidad de los términos empleados, estableciendo un juego de referencias, cuando sea preciso, para relacionar, completar o no marginar temas. Utilizan un lenguaje precoordinado y un vocabulario controlado. Es un lenguaje no jerárquico, aunque sí guarda relación de jerarquía dentro de cada concepto.

 Uniterms: cada término representa una palabra-clave sin determinar el nivel que hay de asociación: esta se realiza al recuperar la información. Fue introducida por Taube en 1953. Para la utilización de este sistema es necesario el uso de fichas uniterms y de ficheros inversos. Una variante sería el sistema Peek-a-book, que utiliza fichas de coincidencia óptica.

 Descriptores. Se denomina descriptor al término o grupo de términos que representan un concepto preciso. Básicamente son los términos de un thesaurus, pero su denominación se ha ampliado para calificar las palabras-clave normalizadas o controladas y que no formen parte de un léxico de materias, sino de descriptores: el término descriptor debe ser más preciso y unívoco que el término materia. La indización basada en descriptores la inició en 1947 Mooers, presentando el sistema Zator, que posibilita combinar o coordinar libremente los conceptos.

 Indices permutados.- Consiste en la permutación, en forma circular, de todas las palabras del título o del texto, con el fin de distinguir la palabra que se utiliza como descriptor. Esta lista de títulos permutados es utilizada de modo semejante a un índice de materias. Su originalidad radica en que se halla confeccionada mediante palabras del lenguaje natural contenidas en el texto y que sirve de base para la edición del índice.

 Indices KWIC (key word in context). Consiste en reunir cada palabra significativa del título o el texto en una lista alfabética, de forma que, a su vez, estén recogidas todas las palabras significativas del mismo. La palabra elegida aparece siempre en el mismo lugar, en el centro.

 Indices KWOC (key word out of context). se basan en el mismo principio, pero con la diferencia de que no presentan la palabra significativa en el texto mismo, sino sobresaliendo fuera del título: el término que realiza la función de descriptor se sitúa encabezando el título completo.

 Indices cruzados (Dual Dictionnaires). Concebidos para la búsqueda retrospectiva, facilitan la intersección de conceptos. Se basa en descriptores, ordenados alfabéticamente y seguidos de los números de los documentos a los que describen, ordenados por sus números finales del 0 al 9. La recuperación se hace mediante la confrontación de dos índices cruzados.

 Indices acumulativos. Son boletines que acumulan los índices de un periodo determinado. Normalmente es un tipo de publicación mensual que acompaña al boletín de resúmenes. Ayudan a limitar el número de boletines de consulta.

 Indice de citas. Son índices de autor con características especiales, ya que no sólo se cita junto a cada autor la lista de documentos publicados por él, sino que añade en cada referencia la lista de documentos que han citado esta referencia en su propia bibliografía.

Subir

 

 Lenguajes documentales según su nivel de análisis.

Dado que el objetivo de la tarea documental consiste en transmitir información, es importante conocer cuánta información de un documento original puede transmitir un lenguaje documental. Esto daría lugar al siguiente cuadro:

 Nivel de análisis: superficial.

 Lenguaje documental: categorías / materias.

 Tipo de coordinación: precoordinado.

 Tipo de vocabulario: controlado

 Clasificaciones.

 Nivel de análisis: medio.

 Lenguaje documental: conceptos o descriptores.

 Tipo de coordinación: postcoordinados.

 Tipo de vocabulario: libre o controlado.

 Thesaurus.

 Nivel de análisis: profundo.

 Lenguaje documental: explicativo.

 Tipo de coordinación: postcoordinados.

 Tipo de vocabulario: libre.

 Uniterms y Abstracts.

 

Un documento puede estar representado por un índice de clasificación, varios descriptores y un resumen corto o largo. Es decir, la representación puede tomar formas más o menos elaboradas que lejos de excluirse, se complementan.

 Primer nivel. El nivel más específico de la representación del contenido se obtiene mediante el uso de los sistemas de clasificación. Cuando se le atribuye un índice de clasificación a un documento, se le incluye en una categoría, en la cual existen otros documentos con características similares, y agrupados bajo el mismo índice. La representación del documento generada por la aplicación de un sistema de clasificación es más general que el documento mismo.

 Segundo nivel. El siguiente nivel se obtiene con la aplicación del léxico alfabético por materias, que no sólo representan categorías, sino además el tema o temas desarrollados por el autor en el texto.

 Tercer nivel. El último nivel de representación no utiliza ninguno de los lenguajes documentales descritos anteriormente: el instrumento utilizado es el lenguaje natural, ya que sólo el resumen permite transmitir toda la información deseable en este nivel de profundidad.

Subir

 

El Thesaurus.

Las normas ISO establecen la definición de este tipo de lenguaje de acuerdo con su función o su estructura. Según su estructura, es un vocabulario controlado y dinámico de términos que tienen entre sí relaciones semánticas y genéricas y que se aplica a un campo particular del conocimiento. Según su función, es un instrumento de control de la terminología, utilizado para trasladar al lenguaje documental el lenguaje natural utilizado en los documentos. Participa de la estructura asociativa y jerárquica y deben tenerse en cuenta los siguientes aspectos:

 Descriptores: términos retenidos con objeto de llevar a cabo la indización de documentos. Pueden representar conceptos o combinaciones de conceptos y entidades individuales.

 Presentación formal de descriptores. los descriptores pueden constar de una o varias palabras, aunque debe comprender el mínimo posible: los descriptores compuestos seguirán el orden natural de las palabras.

 Presentación formal de las palabras. Una vez que se decide retener un término en el thesaurus, hay que intentar que alcance el máximo de expresividad, revisando aspectos tales como ortografía, número, adjetivación, etc.

 Uso de métodos para evitar la ambigüedad: relaciones que deben impedir los problemas creados por la homonimia, polisemia, etc.

 Relaciones entre descriptores. Representación de las relaciones que se establecen entre descriptores y que pueden ser de equivalencia, jerárquicas y asociativas.

Subir

 

 

El ordenador y los lenguajes documentales.

Todos los lenguajes que se han expuesto pueden ser elaborados y consultados de forma manual o mecánica. Sin embargo, el ordenador ha permitido, de hecho, la creación y edición de una serie de léxicos de descriptores cuya elaboración manual hubiera resultado imposible.

Por otro lado es corriente que una base de datos de cualquier disciplina disponga en sus sistema de una clasificación especializada, un índice alfabético de materias y un léxico de descriptores o thesaurus, además del acceso a través del lenguaje libre. La importancia reside en saber conjugarlos para obtener la mejor información deseada.

Subir

Volver a:

Zaguán

Libros, bibliotecas, bibliotecarios

Rosario López de Prado

rlp@man.es

Museo Arqueológico Nacional (BIBLIOTECA)

Última revisión: 6 de mayo de 2000