Universidad Carlos III de Madrid

Modelos de recuperación

Sistemas Avanzados de Recuperación de la Información

Esta página cumple los requisitos de validación del consorcio W3C. Valida tu CSS


Test de Accesibilidad web- Nivel A


Test de Accesibilidad web- Nivel AAA


[Valid RSS]

El modelo probabilístico

Introducido en la década de los setenta por Robertson y Sparck Jones, también es conocido como modelo de recuperación de independencia binaria (BIR)11. Este modelo se basa en las siguientes consideraciones:

- Para caracterizar los documentos de la colección se han empleado ciertos términos de indización (palabras en principio).

- Dada una necesidad informativa del usuario, existe un subconjunto de documentos de la colección que contiene exclusivamente los documentos relevantes en relación a ella.

El modelo probabilístico parte exclusivamente de la presencia o ausencia de los términos en los documentos de la colección. Se trata también de un modelo binario, como el modelo booleano.

En un caso real el usuario no sabe cuáles son los términos de indización que configurarían la consulta ideal. Tampoco sabe, en qué medida los términos empleados en la consulta permiten discernir los documentos relevantes y rechazar simultáneamente los documentos irrelevantes.

La gran aportación del modelo probabilístico a la recuperación de información consiste en el fenómeno denominado retroalimentación por relevancia: la utilización de información generada bien en procesos de recuperación anteriores, bien durante el propio proceso de búsqueda.

Página realizada por Carmen Vega
Estudiante de Documentación - Sistemas Avanzados de Recuperación de Información"
Universidad Carlos III de Madrid