Recuperación de la información. Búsquedas retrospectivas y D.S.I. Soportes informáticos.

Índice

 Introducción

 Vías para la recuperación de la información

 Búsquedas bibliográficas retrospectivas

 Estrategia general de la búsqueda

 Difusión selectiva de la información

 Sistemas de recuperación documental

 Criterios de relevancia

 

Introducción.

El concepto de recuperación de la información consiste esencialmente en extraer de una colección de documentos aquellos que se ajustan a las especificaciones de una petición determinada. Se trata, pues, de una comparación sistemática entre los documentos o sus representaciones y la petición o demanda de información, y para ello es preciso que los dos elementos que se comparan estén expresados en el mismo lenguaje o lenguajes compatibles.

La eficacia de la recuperación se basa en la eficiencia del análisis, el cual se hace en función de ella. Teóricamente, la búsqueda y recuperación de la información es un proceso que debería poder realizar el usuario por sí mismo, siempre sobre el supuesto de un análisis sin fallos realizado por el documentalista. Sin embargo, ello está lejos de cumplirse en la práctica, bien por deficiencias en el análisis o, lo que es más corriente, incapacidad del usuario para expresar correctamente sus demandas. Esta incapacidad, que en cierto grado se da en la mayoría de los usuarios, se acrecienta enormemente cuando el demandante no es especialista en la materia que investiga, desconoce los instrumentos de búsqueda documental o ambas cosas. Por ello es fundamental la figura del documentalista que servirá de puente entre el usuario y la información, traduciendo sus demandas a un lenguaje más preciso, estricto y controlado y permitiendo así el acceso al documento.

Esta función es tanto más importante, cuanto el problema real con que se enfrenta el hombre actual no es el de la escasez de información, sino la abundancia de documentación. La imposibilidad de examinar personalmente todos y cada uno de los documentos que diariamente se elaboran en el mundo, provocan un auténtico ahogo de información que, al final, impide el acceso a aquella documentación que responde exactamente a la demanda formulada. Es, pues, la selección de entre la masa documental, la característica más destacada en el proceso de búsqueda.

Subir

 

Vías para la recuperación de la información.

Cualquier sistema de información científica proporciona la información analizada y memorizada en su fondo siguiendo cinco vías de acceso y difusión de la misma. Ello da nombre a cinco tipos de servicios diversos con metodología independiente y propia:

 Servicios de búsquedas bibliográficas retrospectivas.

 Servicios de difusión selectiva de la información.

 Servicios de referencia.

 Servicios de obtención del documento.

 Servicios de publicaciones.

A veces un mismo sistema documental puede ofrecer los cinco sistemas citados y, a veces, sólo algunos de ellos. Sin embargo es obligado que toda biblioteca científica o centro de documentación lleve a cabo, al menos, búsquedas bibliográficas y tramitación de documentos originales, reproducidos o no.

Subir

 

 

Búsquedas bibliográficas retrospectivas.

Es la operación o consulta documental que se sigue a la demanda efectuada en un momento dado por un usuario o grupo de usuarios y se refiere al conjunto de documentos o referencias bibliográficas publicados hasta el momento de la búsqueda sobre un tema, autor, trabajo, investigación e información diversa. Recibe el nombre de retrospectiva porque proporciona información bibliográfica desde un número determinado de meses o años anteriores a la fecha en que se efectúa la demanda.

Subir

 

 

Estrategia general de la búsqueda.

Se tiende cada vez más a que sean los propios usuarios quienes interroguen directamente al sistema documental, de forma manual, mecánica o automatizada: sin embargo, por el momento, y por las razones expuestas anteriormente, la figura del documentalista es esencial en el proceso de búsqueda y recuperación.

La estrategia de la búsqueda bibliográfica consiste en la sucesión de las etapas que conducen a la ejecución de la pregunta. No existe una sola estrategia, ya que éstas se definen en función de varios factores, tales como exhaustividad, tiempo, coste, etc. Será la experiencia de quien realice la búsqueda y su conocimiento del fondo consultado y las técnicas a emplear los que decidan la utilización de una estrategia u otra. Básicamente, se compone de los siguientes pasos:

 Definición de la pregunta. El usuario formula su pregunta: es labor del documentalista dirigirlo para que precise y delimite su necesidad informativa. Para ello se utilizan impresos-tipo y entrevistas personales con el usuario.

 Análisis y preparación de la búsqueda. Una vez precisados los términos que le interesan al usuario se pasará a buscar todos los conceptos contenidos en ellos.

 Traducción de la pregunta al lenguaje documental. La expresión que resulta de esta operación se llama expresión o modelo de búsqueda del documento. Su preparación pertenece al campo de la indización.

 Preparación de perfiles de búsqueda. Es la operación fundamental en el proceso. Consta de tres partes bien diferenciadas:

 Identificación de los conceptos elegidos en la etapa anterior.

 Desarrollo o expansión de los mismos mediante una colección de términos afines.

 Expresión de las relaciones entre los términos mediante los operadores lógicos Y, O, NO.

 Comparación sistemática de los modelos de búsqueda con el perfil de búsqueda, con el fin de seleccionar los que se ajusten a éste.

 Respuesta a la consulta bibliográfica. Consiste en proporcionar al usuario las referencias bibliográficas obtenidas.

Subir

 

 

Difusión selectiva de la información.

La Difusión Selectiva de la Información supone un tratamiento y explotación periódica de las informaciones documentales más recientes, memorizadas y difundidas periódicamente en respuesta a los perfiles documentales definidos por los utilizadores. Consisten en la selección de las referencias que interesan a un tema preciso llamado perfil, permitiendo al utilizador conocer regularmente, y a medida que estas referencias quedan registradas en los ficheros documentales, los textos, artículos y otros documentos que acaban de publicarse sobre ese tema.

El perfil documental es una ecuación de búsqueda permanente formulada por un usuario con ayuda de descriptores o palabras-clave que se encuentran en el sistema hacia el que se dirige. Lo realiza cada usuario o grupo de usuarios que tenga necesidad documental constante durante un periodo determinado. Generalmente, el centro de documentación facilita un periodo de prueba durante el cual el usuario recibe gratuitamente las referencias que responden a su perfil, para añadir correcciones y ajustar al máximo la formulación adecuada a su demanda. Una vez definido el perfil, el usuario recibe periódicamente la información ajustada a su demanda, en forma de referencias y resúmenes, generalmente en forma de fichas recortables. La reproducción de documentos originales puede obtenerse a partir de estas fichas.

El perfil puede ser de tres tipos:

 Perfil personal: adaptado al tema preciso que demande el usuario.

 Perfil standard o normalizado: temas de interés seleccionados por el propio centro de documentación que propone a sus usuarios.

 Perfil de grupo: demanda realizada por un grupo de usuarios.

Subir

 

 

Sistemas de recuperación documental.

La recuperación documental puede realizarse siguiendo tres tipos de procedimientos: manuales, mecánicos y automatizados. Unos y otros se basan, bien en el documento, bien en el descriptor, aunque los sistemas informatizados permiten la conjunción de ambos. Así pues, podemos clasificar los sistemas de la siguiente forma:

A) Sistemas basados en el documento. A cada documento le corresponde una ficha con todos sus datos. La búsqueda obliga a la revisión de todas las fichas. Las más utilizadas son:

 Fichas perforadas. Constan de una zona de descripción del documento y otra de perforación que indica, de forma codificada, las características por las que se puede recuperar el documento. Se presentan en dos formatos:

 de perforación marginal: la selección se hace paquete por paquete con el uso de agujas.

 de perforación central: la selección se hace por selector-vibrador, utilizando agujas múltiples.

 Selección por microcopia. Es un sistema costoso, ya que necesita el concurso de la microfotografía, la electrónica y la mecánica. Los documentos aparecen microfilmados, y cada una de sus fichas divididas en tres partes:

 identificación y clasificación visual

 códigos gráficos de los descriptores

 ficha bibliográfica.

La palabra clave se inscribe sobre cartones codificados. Para su selección, el conjunto de microcopias debe pasar por el aparato selector, por el lector y finalmente, si procede, por el reproductor de microfichas (ampliadora-fotocopiadora). La recuperación se logra por selección manual del número de código, por selección manual de la microforma, por selección automática a través de códigos de búsqueda o por acceso automático.

 Sistemas basados en el descriptor. A cada campo temático le corresponde una ficha en la que se indican todos los documentos relacionados con él. La búsqueda se realiza mediante el examen de las fichas que respondan a las características de la demanda. Necesita el uso de un fichero auxiliar ordenado por el número de entradas.

 Uniterms. Parte de la elaboración del thesaurus. Los documentos se numeran correlativamente (número de llamada); cada descriptor tiene una ficha dividida en columnas numeradas del 0 al 9, donde se colocan los números de llamada correspondiendo con el último dígito. La recuperación se hace mediante la comparación de fichas de descriptores y la búsqueda de correspondencias. Concebido en 1953 como técnica manual, hoy está mecanizado.

 Peek-a-book. Como el sistema uniterms, cada ficha lleva la palabra clave en la parte superior: el campo está cuadriculado en pequeños rectángulos donde se establece un sistema de abcisas y ordenadas: las perforaciones se realizan en los puntos que indican números de acceso a todos los documentos que contienen la información demandada, y que se sitúa en las intersecciones de las coordenadas correspondientes. Las búsquedas se realizan mediante superposición de fichas y observación de la correspondencia de las perforaciones, por luz, agujas o cualquier otro sistema.

 Sistemas de recuperación por ordenador.- De todos los sistemas utilizados, el sistema de recuperación por ordenador es el más perfecto gracias a su rapidez, difusión, especialización y rentabilidad.

El sistema de recuperación automatizado requiere para su posterior utilización dos operaciones fundamentales: almacenamiento, ordenación y memorización de los documentos y organización de los ficheros documentales. La primera de las operaciones se realiza automáticamente con la entrada de las referencias bibliográficas en el ordenador, siguiendo un programa establecido de antemano y ya cargado en la memoria central. La segunda de las etapas consiste en la organización de los siguientes ficheros:

 Fichero diccionario: en él se registran todos los descriptores que caracterizan a los documentos y los no descriptores relacionados entre sí, codificados e identificados por números. Todos los sinónimos de un término llevan el mismo número. Esto permite el acceso directo: ante una consulta, el ordenador nos dará todos los documentos registrados bajo el descriptor, sin necesidad de consultar todo el fichero.

 Fichero de documentos: en él se registran los documentos por el número de descriptor a que se refieran. Junto al número del descriptor están los números de todos los documentos registrados bajo ese descriptor. En la recuperación, el ordenador nos da todos los descriptores solicitados junto a los números de los documentos a los que se refieren estos descriptores. Para la realización de este fichero se comienza por elaborarlo en forma de fichero directo: lista de documento identificado por su número de registro y seguido del conjunto de números de los descriptores utilizados para su indización: para proceder a la recuperación de los documentos, el fichero se transforma en inverso -número de descriptor seguido de número de documentos.

 Fichero bibliográfico: en él aparecen registradas todas las referencias bibliográficas junto con sus resúmenes, de forma secuencial.

 Fichero estadístico: se crea automáticamente como un subproducto de la actualización del fichero inverso y se emplea con fines de comprobación y estudios de eficacia, así como para informes de gestión.

Una vez formulada la demanda documental e introducido en el ordenador por el documentalista o usuario, aquel se encargará, a través de los ficheros mencionados, de seleccionar y recuperar las referencias documentales que se ajusten a la demanda, con gran rapidez y con la pertinencia y exhaustividad requeridas.

Subir

 

 

Criterios de relevancia.

Una vez obtenidos los documentos que respondan a las demandas de los usuarios, debe comprobarse si estos satisfacen los requisitos del peticionario, es decir, su relevancia, y si se recuperan todos los documentos que respondan a ello, es decir, su exhaustividad. Los criterios de relevancia de un documento se basan en tres aspectos: necesidad de la información, petición y perfil de búsqueda. A menudo la petición no coincide con las verdaderas necesidades; otras veces no coincide la petición con el perfil de búsqueda. En consecuencia, para medir el grado de adecuación de la respuesta a la búsqueda, hay que introducir tres conceptos distintos:

 relevancia formal: adecuación de los resultados al perfil de búsqueda,

 relevancia semántica: adecuación a la petición de información,

 pertinencia: adecuación a la necesidad de información.

La medida de la pertinencia de un documento es imposible por subjetiva y sería el resultado de la búsqueda perfecta: conjunto de documentos que el mismo usuario seleccionaría como relevantes en el caso de que él mismo pudiera ver todo el conjunto documental existente. Sin embargo, puede hacerse una estimación cuantitativa de la pertinencia mediante la aplicación de las tasas de exhaustividad y precisión.

 Documentos recuperados relevantes: a

 Documentos recuperados no relevantes: b

Total documentos recuperados: a+b

 Documentos no recuperados relevantes: c

 Documentos no recuperados no relevantes: d

 Total documentos no recuperados: c+d

 Total documentos relevantes: a+c

 Total documentos no relevantes: b+d

 Total documentos: a+b+c+d

 Tasa de precisión: P= (a/a+b)x100

 Tasa de exhaustividad: E= (a/a+c)x100

Los valores óptimos de precisión y exhaustividad dependen en gran medida del tipo de búsqueda y de los intereses que mueven a la misma. El factor coste es asimismo importante. Para mejorar la eficacia de una búsqueda, los mejores resultados se consiguen mediante el ajuste del perfil en aproximaciones sucesivas, con la colaboración del peticionario.

Subir

Volver a:

Zaguán

Libros, bibliotecas, bibliotecarios

Rosario López de Prado

rlp@man.es

Museo Arqueológico Nacional (BIBLIOTECA)

Última revisión: 6 de mayo de 2000