COMPONENTES TÍPICOS DE UN SISTEMA DE EXTRACCIÓN DE INFORMACIÓN (SEI)
Nivel de texto: determina la relevancia de los textos o partes de los mismos por medio de estadísticas de ocurrencias de determinados patrones de palabras.
Nivel de palabras: marca las palabras según su función. Generalmente, utiliza métodos estadísticos entrenados con textos pre-etiquetados.
Nivel inter-sentencias: reconoce y unifica expresiones de referencia solapando y mezclando las estructuras anteriores.
Nivel de plantillas: formatea la salida en la forma predefinida.
Anterior: Funciones del SEI
Siguiente: Tipos de documentos
|
SECCIONES
|