EL PLN PARA LA RECUPERACIÓN DE INFORMACIÓN
La RECUPERACIÓN DE INFORMACIÓN (RI) mediante PROCESAMIENTO DEL LENGUAJE NATURAL (PLN) surge como una evolución de los buscadores tradicionales que tratan de eliminar algunos sesgos que acompañan a muchos de estos motores, tratándolos de hacer más operativos en la búsqueda y recuperación de información.
La introducción del PLN en los buscadores hace que la búsquedas sean más naturales y sencillas, ya que este sistema es capaz de interpretar las consultas hechas en LN por los usuarios y de cargarlas de sentido para que su recuperación sea lo más precisa posible.
Como principal problemática el PLN para la recuperación de información se encuentra con AMBIGÜEDAD del LN, para superar dicho problema los motores de búsqueda deben introducir en sus sistemas analizadores morfolingüísticos que le ayuden a interpretar el LN de forma precisa:
- Analizador o generador morfológico:situado dentro de la morfología informática, por lo que requiere del conocimiento de la morfología. Sus unidades de estudio: morfemas, lexemas, palabras y las reglas que rigen su combinación. Estos analizadores también se encargan de la formación de las palabras: a través de la flexión en el caso de los verbos, composición, derivación…
- Analizador o generador sintáctico:La sintaxis estudia las relaciones que las palabras contraen en la oración, por ello analiza las oraciones y sus elementos. El analizador o generador sintáctico se ocupa de identificar las relaciones, que son relaciones lineales, relaciones de constitución y relaciones jerárquicas, que se producen dentro de los elementos de un enunciado.la unidad del analizador o generador sintáctico es la oración y los elementos de la misma.
- Analizador o generador semántico:consiste en asociar a una secuencia de palabras una representación con sentido propio. Se distinguen dos tipos:
- Semántica léxica: que procede del sentido o del significado de las palabras.
- Semántica gramatical: que procede del sentido o del significado que se desprende de las relaciones sintácticas.
- Análisis pragmático: se ocupa de descifrar el contenido literal de lo que se dice, palabra por palabra, frase por frase y es capaz de unir las frases de manera que formen un todo coherente, es decir, ser capaz de interpretar el mensaje recibido, con relación a la situación y a las condiciones de enunciación.