Buscadores |
* Los buscadores automáticos son aquellos que a partir de cierta información entregada en lenguaje natural o en alguna especificación puede deducir y recuperar la información que uno está buscando. * Su objetivo es encontrar los documentos que contengan las palabras claves introducidas. Habitualmente localiza los documentos Web que mejor se adapten a las palabras introducidas. ¿Cómo son y cómo funcionan? Los buscadores automáticos están compuestos por tres partes: * Los robots que recorren la red escrutándola. * La base de datos que es construida por los robots. * El motor de búsqueda que facilita la consulta a la base. Al conectar con algún buscador automático nos encontraremos con un documento que contiene un formulario para definir nuestra búsqueda y las opciones de la misma; tras rellenarla, enviarla y esperar unos segundos, el buscador nos devolverá una lista de lugares donde figura nuestra búsqueda. Así pues tendremos dos áreas según el propósito: 1. Formular la búsqueda y enviarla. 2. Lista de resultados, ordenados según su semejanza con las palabras claves introducidas. Si no conseguimos los resultados deseados, volver al inicio, pero modificando la estrategia de búsqueda según la observación de los resultados. Robot Son programas que buscan continuamente por todos los servidores de WWW (también en los de News , Gopher y FTP), construyendo un índice de lo hallado. También son conocidos como arañas por su continuo desplazamiento sobre la red o telearaña. Base de datos Contiene todos los URL encontrados, y asociados a ellos, la información relativa sobre sus contenidos: * Su título * Parte de texto * Hiperenlaces * Descriptores (palabras claves) * Etc. Está actualizada continuamente por los robots que añaden nuevas páginas o referencias, actualizan las que han cambiado y borran las que ya no existen. Motor de búsqueda Es la parte que vemos cuando realizamos la búsqueda. Después de introducirle una petición de búsqueda o consulta, el motor de búsqueda la coteja con la base de datos y devuelve una lista ordenada de las coincidencias. La lista está ordenada según la relevancia de la consulta colocándose primero las más coincidentes. Si la consulta contiene más de un término o palabra los buscadores suelen realizar la búsqueda como si hubiéramos colocado el operador "OR" lógico entre los términos. Palabras claves (keywords) Son aquellas palabras o términos que usamos para describir los conceptos o ideas que búscamos. No son sólo las palabras habituales, sino también cualquier secuencia de caracteres que sirva para localizar nuestro objeto, aunque no sean pronunciables. Estas palabras están normalmente separadas por espacios en blanco. Y no debemos incluir signos diferentes a los alfanuméricos, a no ser que representen alguna función especial como + - & | ! ya que la mayoría de los buscadores no los tendrán en cuenta. Opciones Algunos buscadores cuentan con diversas preferencias que el usuario puede "activar" o "desactivar", dependiendo de lo que se esté buscando. Entre las que podemos mencionar: => Seleccionar dónde se buscará: Web News FTP , etc. => Tipos de búsqueda basados: * En conceptos o contexto (encontrará sinónimos). * En palabras claves. * En algun ejemplo o páginas encontradas previamente. Retroalimentación. => Buscar las ocurrencias en determinados campos: * Título * URL * Comentario , etc. => Distinguir mayúsculas y minúsculas. => Buscar ocurrencias que contengan: * Como mínimo una de las claves (o lógico). * Todas las claves (y lógico). * Que no contengan (no lógico). * Dos claves próximas (cerca). * Dos claves adyacentes. * Algunas claves como una sola cadena de caracteres (frase). => Considerar las palabras claves como: * Subcadenas de caracteres. * Palabras enteras. => Limitar el número de ocurrencias. => Seleccionar el grado de detalle en el listado de resultados: * Estandar. * Compacta. * Detallada. => Modo de resultados: * Normal (sin comprobar la existencia de repeticiones). * Verificación o Comprobación. Deficiencias No maneja información imprecisa. Dará mayor importancia a un documento que tiene mayor cantidad de ocurrencias y manejará mal la información imprecisa pero relevante para el usuario. Es mejor, hoy por hoy, usar varias herramientas de búsqueda para manejar grandes volúmenes de datos y hacer nosotros el análisis semántico y el proceso de filtrado definitivo. |