FICHERO INVERSO

ÍNDICE

1.- MARCO DEL FICHERO INVERSO

El fichero inverso proviene de la acción de indizar, que produce indices en los cuales se ven las relaciones de las palabras con respecto al documento del que se realiza la indizacion. Cuando esta indizacion la realizamos de un documento y los resultados los transcribimos a un procesador de datos con la finalidad de recuperar información, estamos creando un fichero.

Un fichero es una coleccion de datos almacenados, de modo que sean legibles por el ordenador, lo cual supone una estructuración que haga posible dicha lectura. Para crear un fichero se tiene que hacer desde una base de datos. Lo primero para crear una base de datos hay que diseñar un fichero principal en el que figuren todos los registros.

Existen diferentes tipos de ficheros a parte del fichero inverso algunos de ellos son:

Ficheros planos.
Ficheros de firmas.
Arboles PAT.
Ficheros lineales.

2.- DEFINICION

Un fichero inverso o también llamado fichero invertido es un tipo de fichero índice donde la estructura de cada ítem (o entrada) del fichero es, generalmente:
- palabra clave, identificador de documento, identificador de campo

Una palabra clave es un término índice que describe al documento, el identificador de documento es único para cada documento y un identificador de campo es un término que nos indica dentro de qué campo del documento aparece la palabra clave.

Algunos sistemas incluyen también información acerca de la localización en el documento del párrafo y frase de los términos utilizados para proceder a interrogar la base de datos. La búsqueda se realiza, corrientemente, por medio de la localización de los términos solicitados en el fichero inverso.

3.- CONSTRUCCION

La construcción de un fichero inverso se realiza de la siguiente manera:

Conseguir una lista de las palabras que aparecen en el texto, junto con su locaclización en el mismo.
Invertir la lista anterior: conseguir una lista de términos ordenados lexicográficamente y por orden de aparición (con las localizaciones asociadas a los términos).
Opcionalmente postprocesar el fichero inverso, añadiendo peso a los términos, reorganizándolos o comprimiéndolos.

4.- FUNCIONAMIENTO

El fichero inverso contiene ordenadas alfabeticamente todos los terminos con significado semantico, es decir que no sean palabras vacias, contenidos en los documentos de una base de datos que ya esta construida.

A la hora de realizar una busqueda a lo largo del fichero el robot no lee todos los documentos sino que sencillamente realiza la busqueda en el fichero inverso y en cada una de las ocurrencias de los terminos buscados. El resultado que obtenemos son los documentos en los que aparece esa palabra por la que hemos realizado la busqueda. Normalmente el sistema al finalizar dicha busqueda espera nuevas ordenes del usuario y que estas pueden ser realizar otra busqueda, mejorar la busqueda anterior, ver los documentos que nos ofrece, etc.

Gracias a la interactuacion del fichero inverso y de los operadores booleanos u logicos podemos recuperar la informacion. Ello se realiza mediante la combinacion de los terminos junto con los operadores logicos crea una ecuacion, la cual se transforma por medios informaticos. Selecciona y compara, mediante la aplicación de la teoria de conjuntos, que va unida a los operadores booleanos, los resultados de la consulta al fichero inverso, y selecciona, de acuerdo a los operadores establecidos por el usuario, aquellos que responden a la logica de la ecuacion de busqueda.

5.- ENLACES

Enlaces interesantes a otras paginas y que puede ayudar a la comprension de la recuperacion de la informacion

Victor Manuel Mendoza Hidalgo
100047208(arroba)alumnos.uc3m.es

Si se estas interesado en el autor de la pagina, aqui puedes ver su curriculum vitae

Contador
RDF