COLECCIONES DE PRUEBA
Las colecciones de prueba resultan herramientas esenciales para los invetigadores dedicados a la recuperación de la información. Son supuestos que resultan novedosos y permiten obtener resultados reales.
En un primer momento contenian cientos de documentos, y en la actualidad significan una gran innovación y han servido de antecedente para futuras investigaciones relacionadas con los Sistemas de recuperación de la información. Destaca en 1957-1968 Cleverdon y los Experimentos Cranfield en el campo de la aeronáutica.
Componentes de las colecciones de prueba:
- CORPUS: Conjunto de documentos.
- NI: Conjunto de necesidades de información.
- Juicios de relevancia que relacionan las NI con los documentos del corpus.
Otras Colecciones de prueba:
- MUC; Tienen como objetivo el desarrollo de sistemas de recuperación y extracción de información. Al igual que las Conferencias TREC, han sido fundadas por DARPA, y se rigen por normas de evaluación.
- DUC
- CLEF; El propósito de estas conferencias es promover y ayudar al acceso de información multilingüe a través de evaluaciones de sistemas de recuperación de información.
- SENSEVAL; Se dedica a evaluar los programas automáticos dirigidos a la determinación del sentido de las palabras, variedades de la lengua e idiomas.
- NTCIR; Conferencias destinadas a la investigación y mejora del acceso a la información. Incluye tecnologías de recuperacion de información, técnicas de pregunta- respuesta, resumen del texto, extracción de datos, etc.