EXTRACCIÓN DE INFORMACIÓN (EI)

FUNCIONES DE SISTEMAS DE EXTRACCIÓN DE INFORMACIÓN (SEI)

Las funciones de los Sistemas de Extracción de Información (SEI) pueden diferir, ya que dependen de cómo se quiera modelar un sistema y del dominio específico en el que se esté trabajando. Sin embargo, el proyecto MUC (Message Understanding Conference) establece un conjunto genérico de funciones como punto de referencia para la mayoría de los Sistemas de Extracción de Información (SEI).

Un Sistema de Extracción de Información (SEI) debe cumplir cuatro funciones fundamentales, cada una de ellas orientada a la extracción de un tipo de información concreto a partir de los documentos existentes en un dominio restringido.


  1. Reconocimiento de entidades, Named Entity Recognition (NER): es una subtarea de la Recuperación de Información (RI) que se encarga de identificar y clasificar los nombres propios. Pero además de reconocer si una palabra es un nombre propio, también debe identificar si ese nombre propio se refiere a una persona, a un lugar, a una organización, etc.


  2. Resolución de anáforas: es otra subtarea de la Recuperación de Información (RI) que intenta identificar el significado de los pronombres dentro de un texto. Se trata de un problema complejo de resolver, ya que existen cantidad de referencias mediante el pronombre "lo" dentro de un texto; y sin comprender el contenido del mismo, resulta muy dificil determinar su significado.


  3. Reconocimiento del rol: constituye también otra subtarea de la Recuperación de la Información (RI) que busca reconocer el papel que tiene una persona, objeto o lugar dentro de un texto.


  4. Reconocimiento de relaciones: esta subtarea de la Recuperación de Información (RI) busca identificar relaciones semánticas entre varias entidades de un texto. A diferencia de las anteriores subtareas que realizan el análisis a nivel de la oración, esta subtarea se realiza a nivel de texto.

Anterior: Sistemas de Extracción de Información (SEI)

Siguiente: Componentes del SEI

SECCIONES

Creado por: Iratxe Urien Larrabide

Sistemas Avanzados de Recuperación de Información (SARI) 2009, Universidad Carlos III de Madrid

Última actualización: 18/05/2009

RDF Resource Description Framework Test de accesibilidad web versión 3 Valid HTML 4.01 Transitional ¡CSS Válido! FOAF RSS¡Suscribete a RSS EI!