Recuperación de imágenes y videos en Internet

Recuperación de la información


Recuperación de imágenes


La recuperación de imágenes puede hacerse mediante los métodos antes mencionados:

Sistemas de recuperación basados en el contexto en el que aparece el documento.

Sistemas de recuperación basados en el contenido del documento:


Recuperación de imágenes basada en el contexto en el que aparece la imagen

Las consultas que se realizan a los motores de búsqueda convencionales para localizar imágenes se hacen a través de texto: al introducir una sentencia de búsqueda en el motor, éste devuelve los resultados que incluyen dicho texto en alguna de sus partes. Cuando se lanza una consulta al buscador, por ejemplo con la palabra casa, éste devuelve todos los resultados que contenían esa palabra en alguna parte de su texto.

Éste método funciona bien para documentos textuales, pero cuando lo que buscamos son imágenes la cosa cambia debido a la ambigüedad de la red.

Además, para poder localizar documentos con este método es necesario que el usuario introduzca las palabras exactas que lleven al documento.

El problema de la recuperación de imágenes a través de su contexto es el siguiente:
Si introducimos el término anochecer en el motor de búsqueda de imágenes de Google, obtendremos distintos anocheceres, como estos:

recuperacion informacion imagenes videos recuperacion informacion imagenes videos recuperacion informacion imagenes videos

No obstante, en la misma búsqueda también se obtendrán resultados como estos:

recuperacion informacion imagenes videos recuperacion informacion imagenes videos recuperacion informacion imagenes videos

¿A qué se debe esta disparidad? La respuesta es sencilla: los motores comunes hacen sus búsquedas sobre el texto asociado a las imágenes en alguna de sus partes (recuperación por contexto). Si una imagen aparece en una página web asociada a un texto determinado, ésta podrá ser recuperada por alguno de los términos que compongan ese texto. En los tres últimos casos, la palabra anochecer aparecía en alguna parte del documento, pero su significado no se asociaba al contenido de la imagen. Este es el motivo por el que, en ocasiones, se obtienen resultados que poco o nada tienen que ver con nuestra búsqueda.

Arriba


Recuperación de imágenes basada en su contenido: características visuales

La idea de la recuperación de imágenes por su contenido, en este caso sus características visuales, sigue un enfoque distinto a otros. Fundamentalmente consiste en extraer de la imagen los aspectos más representativos, de forma que ésta quede identificada de forma unívoca.

Los aspectos a analizar para hacer posible la posterior recuperación son tres: color, forma y textura.

Un ejemplo de este tipo de recuperación lo podemos encontrar en la página web del Museo del Hermitage de San Petersburgo

Arriba


Recuperación de imágenes basada en su contenido: características no visuales (etiquetas o tags)

La Web 2.0 ha traído consigo un amplio conjunto de nuevos servicios y productos. Ejemplo de ello son las numerosas redes sociales en las que la gente comparte documentos (fotografías de sus viajes, videos, imágenes,etc.). La esencia de este tipo de servicios es la cooperación: se comparte la información en un entorno más social donde todo el mundo puede participar.

Desde el punto de vista de las imágenes, podemos destacar servicios como Pikeo, Flickr, etc.

En este tipo de servicios, la recuperación de imágenes se lleva a cabo a partir de las etiquetas o tags que los usuarios asignan a sus documentos. Se trata por tanto de una indización por descriptores libres, en donde la recuperación es más compleja dada la ambigüedad del lenguaje.

Arriba



Última actualización: 22 de abril 2009
© 2009, Tamara López Faro
Licenciatura en Documentación - Universidad Carlos III de Madrid

Valid HTML 4.01 Transitional ¡CSS Válido! [Valid RSS] RDF Resource Description Framework Icon FOAF FOAF validador