EXTRACCIÓN DE INFORMACIÓN (EI)

COMPONENTES TÍPICOS DE UN SISTEMA DE EXTRACCIÓN DE INFORMACIÓN (SEI)

Los componentes típicos de un Sistema de Extracción de Información (SEI) son los siguientes:


  1. Nivel de texto: determina la relevancia de los textos o partes de los mismos por medio de estadísticas de ocurrencias de determinados patrones de palabras.


  2. Nivel de palabras: marca las palabras según su función. Generalmente, utiliza métodos estadísticos entrenados con textos pre-etiquetados.


  3. Nivel inter-sentencias: reconoce y unifica expresiones de referencia solapando y mezclando las estructuras anteriores.


  4. Nivel de plantillas: formatea la salida en la forma predefinida.

Anterior: Funciones del SEI

Siguiente: Tipos de documentos

SECCIONES

Creado por: Iratxe Urien Larrabide

Sistemas Avanzados de Recuperación de Información (SARI) 2009, Universidad Carlos III de Madrid

Última actualización: 18/05/2009

RDF Resource Description Framework Test de accesibilidad web versión 3 Valid HTML 4.01 Transitional ¡CSS Válido! FOAF RSS¡Suscribete a RSS EI!