LA RECUPERACI脫N DE INFORMACI脫N El funcionamiento de un sistema de recuperaci贸n de informaci贸n est谩 condicionado por su eficacia y por el grado en que satisface las necesidades de sus usuarios. En una operaci贸n de recuperaci贸n de informaci贸n, un usuario recupera un conjunto de documentos, de los cuales unos le van a ser relevantes y otros no. El usuario adem谩s dejar谩 de recuperar otro conjunto de documentos relevantes y otro conjunto de documentos irrelevantes.Uno de los problemas que surgen en la recuperaci贸n de informaci贸n es la abundancia o carencia de informaci贸n, cuando lo que recuperamos es mucho o poco. Dependiendo del tipo de b煤squeda se pueden recuperar multitud de documentos o simplemente un n煤mero muy reducido. Para conocer en qu茅 medida el sistema de recuperaci贸n responde a las peticiones de sus usuarios se utilizan medidas de recuperaci贸n de informaci贸n:
La utilizaci贸n conjunta de estas dos medidas muestra la capacidad de filtro del sistema y da una idea amplia de la eficacia del mismo. LA PRECISI脫NLa precisi贸n (Precision) refleja la eficacia de las b煤squedas, es una medida basada en la relevancia. Se puede definir como la capacidad que tiene el sistema de b煤squeda en coordinar la ecuaci贸n con los documentos m谩s relevantes, es decir, los documentos relevantes recuperados. Para calcular esta medida se utiliza la raz贸n o tasa de precisi贸n, coeficiente que surge de dividir el n锟絤ero de documentos relevantes recuperados, sobre el n煤mero total de documentos de la colecci贸n. Esta medida es mucho m谩s sencilla que la exhaustividad o recall ya que en la exhaustividad el usuario desconoce el n煤mero total de documentos relevantes que tiene la colecci贸n o base de datos. Esta medida es inversamente proporcional a la exhaustividad. Emp铆ricamente se ha demostrado (Ley de Cleverdon) que ambas medidas, exhaustividad y precisi贸n tienden a relacionarse inversamente. Si se intenta aumentar el valor de una, el de la otra disminuye lo que quiere decir que ninguna medida puede ser considerada dependiente de otra, ambas dependen del propio proceso de recuperaci贸n. El punto de equilibrio deseable depende de las necesidades del usuario C锟絣culo de la Tasa de Precisi锟絥 La precisi贸n suele expresarse en un rango que oscila entre 0 y 1, aunque tambi茅n podr铆an expresarse en tanto por ciento. Los valores de la precisi贸n en la recuperaci贸n de informaci贸n variar谩n seg煤n los par谩metros del sistema como pueden ser la cualificaci贸n del documentalista que interroga la base de datos, la calidad del lenguaje documental, la sofisticaci贸n del programa inform谩tico ORIGEN DE LA PRECISI脫NEsta medida fue originalmente propuesta en 1955 por Kent como Factor de pertinencia, entendiendo por pertinencia la medida de c贸mo un documento se ajusta a una necesidad informativa. Para otros autores:
|
La recuperaci贸n de informaci贸n | La precisi贸n | Origen de la precisi贸n |
Introducci贸n al posicionamiento | Bombing Posicionamiento web |
"DMOZ" | Optimizaci锟絥 web |
Exhaustividad | Informaci贸n sobre accesibilidad para ciegos |
Agente de b锟絪quedas | Guia XML |
Esta p谩gina ha sido realizada por Elena Ponce de Landaburu para la asignatura de Sistemas Avanzados de Recuperaci贸n de Informaci贸n (SARI), asignatura impartida en la Licenciatura de Documentaci贸n de la Universidad Carlos III de Madrid 脷ltima actualizaci贸n a fecha de 5 de Junio de 2008 |
Mi curriculum Vitae |