| Recuperación y organización de la información | Productos y proyectos de resumen automático | Actualidad del resumen automático | Análisis de un producto de resumen automático |
Actualmente en materia de Resumen automático y recuperación de información existen diversos productos en el mercado, a veces no sabemos cómo seleccionar el mejor de ellos.
Ante cualquier producto de resumen automático y recuperación de información debemos siempre plantearnos cuestiones como: el modo de ejecución, los requisitos del software, el método que emplea para realizar el resumen automático y recuperación de información, etc.
Para tener un mayor conocimiento y aproximación a los productos de resumen automático y recuperación de información, se procede a continuación a explicas las claves a tener en cuenta:
El uso de herramientas de resumen automático y recuperación de información de acceso gratuito es muy variada: algunas pueden ejecutarse on-line (desde la propia página introduciendo nuestros datos), otras tienen versiones demo durante varios días, etc.
En la versión (on-line o no) de toda herramienta de resumen automático y recuperación de información una vez accedemos a la pantalla principal, el interfaz de navegación se presenta en distintos idiomas a seleccionar.
Lo ideal es que nos permita resumir textos de documentos almacenados en nuestro ordenador, textos que se encuentren en Internet o bien introducir de manera manual un texto.
Las herramientas de resumen automático y recuperación de la información deben ofrecer la posibilidad de introducir las palabras que queramos considerar claves y las que queramos considerar vacías en el texto que vamos a resumir, además de disponer de varias opciones entre las que elegir a qué área temática pertenece el texto: / medicina/ química/ finanzas/ prensa, etc.
Debe ofrecer la opción de ponernos en contacto con la empresa del producto de resumen automático y recuperación de información en caso de detectar errores.
Una vez introducimos el texto y seleccionamos las opciones deseadas, la herramienta de resumen automático y recuperación de información debe devolver en unos minutos el texto resumido.
Toda herramienta de resumen automático y recuperación de información debe ofrecer en todo momento la posibilidad de modificar el resumen, hasta que quede del gusto del usuario.
Todo producto de resumen automático y recuperación de información, debe considerar los niveles: morfológico, sintáctico, semántico, lexicográfico, terminológico y pragmático del lenguaje; para ser considerada una herramienta óptima de resumen automático y recuperación de información.
La morfología
Encargada del estudio de la forma y la constitución de las palabras, de cómo un adjetivo está formado por un lexema y unos morfemas de concordancia.
Un buen producto de resumen automático y recuperación de información debe presentar cobertura morfológica.
La sintaxis
Encargada del estudio de las relaciones lineales (por ejemplo, el niño), jerárquicas (como el adjetivo depende del sustantivo) y de constitución (como se constituye un sintagma nominal) que se dan entre los elementos de un enunciado y su elemento de estudio de la sintaxis es la palabra desde el punto de vista funcional, la palabra y la oración.
Un buen producto de resumen automático y recuperación de información debe presentar una cobertura sintáctica.
La semántica
Encargada del estudio del significado lingüístico de las palabras.
Un buen producto de resumen automático y recuperación de información debe presentar cobertura semántica.
La lexicografía
Encargada del estudio de las palabras referentes al léxico de la lengua general.
Un buen producto de resumen automático y recuperación de información debe presentar cobertura lexicográfica.
La terminología
Encargada de estudiar los términos pertenecientes a un área específica del saber humano.
Un buen producto de resumen automático y recuperación de información debe presentar cobertura terminológica.
La pragmática
Esta disciplina estudia el significado extralingüístico de las palabras.
Es difícil que un producto de resumen automático y recuperación de información presente cobertura pragmática, pero puede considerarse como algo positivo que reconozca sinonimias, diferencie palabras homógrafas, etc.
Actualmente existen varios sistemas para el resumen automático y recuperación de información, pero plantean diversos problemas, tanto conceptuales como terminológicos.
Para superar los sistemas comerciales ya existentes de resumen automático y recuperación de información, y avanzar hacia sistemas relativamente más avanzados, o que superen las carencias actuales, deben introducirse recursos lingüísticos, tales como analizadores morfológicos, desambiguadores categoriales, bases de conocimiento léxico, analizadores sintácticos, reconocedores de entidades o sistemas de resolución de anáforas.
Debe ser fundamental el trabajo entre especialistas interdisciplinares, en los que lingüistas e ingenieros informáticos colaboren estrechamente.
En el terreno de la tecnología lingüística, a diferencia de muchas otras áreas de investigación en lingüística y otras ciencias humanas y sociales, los esfuerzos individuales, por meritorios que resulten, raramente suelen conducir a resultados aceptables.
Aunque los sistemas de resumen automático y recuperación de información no logran proporcionar resúmenes con igual calidad que los tradicionales, sí son eficaces para determinados contextos.
Biblilografía:
Sección de descarga de documentos
Contactar con el administrador del sitio:
eva.carbonero@hotmail.com
| Recuperación y organización de la información | Productos y proyectos de resumen automático | Actualidad del resumen automático | Análisis de un producto de resumen automático |
RESUMEN AUTOMÁTICO Y RECUPERACIÓN DE INFORMACIÓN______________Eva Carbonero Guijarro: última actualización 18/05/2009