Universidad Yacambú

Dirección de Estudios Virtuales

Asignatura: Gerencia del Conocimiento

Prof. Javier Carnevali

Elaborado por Maricel Bruce D’Viazzo

Equipo Nº 2

 

 

Trabajo Nº 2

 

Buscadores

 

Acceso Página del Grupo: http://es.geocities.co m/alexi_arias/gdc/T2.HTM

 

 

 

Hoy en día se utiliza esta palabra para referirse a cualquier sitio web cuya función de localizar otras direcciones sea más importante que sus propios contenidos. Sin embargo, a la luz de algunos entendidos en la materia, esta definición es poco satisfactoria ya que hay muchos lugares donde buscar y muchas maneras de realizar la búsqueda.

 

Un motor de búsqueda es un software que realiza búsquedas de archivos almacenados en los ordenadores, un ejemplo son los buscadores de Internet (algunos buscan sólo en la Web pero otros buscan además en News, Gopher, FTP, etc.) cuando les pedimos información sobre algún tema. Las búsquedas se hacen con palabras clave y/o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones Web en los que se mencionan temas relacionados con las palabras clave buscadas.

 

Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitativo). Los buenos directorios combinan ambos sistemas.

 

Definición de Buscadores

 

Los buscadores son programas que permiten hacer búsquedas entre archivos y páginas web en Internet. Las búsquedas son resultados de la base de datos de estos buscadores. Su función principal es mostrar los resultados que tienen más relación con el término o la frase de búsqueda que utilizamos.

 

Existen varios tipos de buscadores:

 


·  Buscadores de Archivos, que sirven para buscar archivos en Internet,

·  Buscadores de Webs que buscan páginas web en Internet.

·  Buscadores temáticos, que buscan webs sobre algún tema en concreto,

·  Buscadores genéricos que buscan cualquier tipo web en Internet. Son los más utilizados y pueden aportar muchas visitas. Muchos de estos motores de búsqueda también incluyen documentos en sus resultados.

 

Un buscador es un programa que periódicamente analiza y valora los contenidos de las páginas de su índice y aplica un algoritmo para emparejar estas páginas con las búsquedas de sus usuarios. No hay intervención humana ni en el análisis o valoración de la página, ni en la construcción de los resultados de búsqueda para lo cual cuentan con robots que se encargan de seguir los enlaces de la WWW visitando nuevas páginas y actualizando su base de datos.

 

Indexamiento y motores de búsqueda

 

Indexamiento es la capacidad de tomar un documento y separarlo en temas relevantes, esta es la mayor función que cubre un motor de búsqueda que posteriormente almacena los resultados para ser llamados cuando una búsqueda referente al tema se realiza.

 

 Robots de Busqueda

 

Un robot es un programa que atraviesa una estructura de hipertexto recuperando ese enlace y todos los enlaces que están referenciados allí. De ello se alimentan los grandes motores de búsqueda de la web.

La diferencia con los Directorios, es que éstos no poseen robots, están operados por humanos y no recuperan automáticamente los enlaces incluidos en las páginas web, sino que sólo se limitan a hallar lo que las personas manualmente incluyen en ellos, pudiendo como ventaja clasificar por secciones la temática de las web al hacer el proceso manual.
Los robots son usualmente llamados "Web Wanderers", "Web Crawlers", o "Spiders" (arañas de búsqueda) y se suele imaginar que se mueven entre los sitios como si fuesen virus, este no es el caso, un robot simplemente visita los sitios y extrae los enlaces que están incluidos dentro de estos.

 

Arañas (Spiders)
Es un robot, pero otorga resultados más fríos.

 

Gusanos (Worms)
Es lo mismo que un robot, aunque técnicamente un gusano es una réplica de un programa, a diferencia de un robot que es un programa original.

 

Orugas (Web crawlers)
Es lo mismo que un robot, pero hay que aclarar que es un tipo específico de robot.

 

Hormigas (WebAnts)
Cooperativa de robots

 

Qué es un Agente:
La palabra "Agente" tiene muchos significados en el mundo de la computación de nuestros días. Específicamente:

 

Diferencias entre Buscador con y sin robot

Buscador sin robot:

Las direcciones añadidas, se ubican en secciones dentro de una estructura de árbol, debiéndose indicar la/s categorías bajo las que se desea queden ubicadas en el proceso de alta.

Los contenidos, en muchos casos, son analizados y procesados por personas que visitarán la dirección añadida, determinando si éste cumple con los requisitos necesarios para ser dado de alta y si los datos introducidos son correctos.

Es imprescindible dar el alta manual de su sitio Web para figurar dentro de la base de datos de los directorios.

Para lograr una buena posición normalmente no es necesario el uso de palabras clave. Usualmente es suficiente con que el título del sitio comience con la letra más cercana a la A en el alfabeto o por alguno de los primeros caracteres de la codificación ASCII.

Hay menos resultados totales debido al menor contenido de sus bases de datos. Estos son mejores, más fiables y presentan menos enlaces erróneos o poco efectivos.

Los resultados aparecen por orden alfabético en la mayoría de los casos y ordenados por categorías temáticas.

Las altas demoran entre 2 a 4 días. Salvo excepciones en que por las características del directorio, llegan a las 2 a 8 semanas en producirse.

Son ideales para hallar páginas sencillas con temas comunes, pues las búsquedas se facilitan.

 

Buscador con robot:

Los contenidos son indexados por medio de un robot, araña o gusano.

No es imprescindible dar el alta a un sitio web para figurar en él. Es aconsejable pero no imprescindible, pues la mayoría de los robots buscan por la web por ellos mismos, indexando todo lo que hallan a su paso. Aun así, el contenido de sus bases de datos no suele superar el 5% del total de la red.

Para lograr una buena posición es necesario el correcto uso de palabras clave y etiquetas dentro del código HTML.

Hay más resultados totales, estos son menos fiables y presentan más enlaces erróneos o poco efectivos.

Los resultados aparecen por orden de popularidad, dependiendo de las características del robot. Puede tomar las palabras clave del título, descripción o contenido.

Las altas pueden llegar a demorar varios meses en algunos casos.

Son ideales para hallar temas intrincados o prohibidos en los directorios de búsqueda, o para encontrar temas poco comunes.

 

Clases de buscadores

Los Spiders

La mayoría de grandes buscadores internacionales que todos usamos y conocemos son de este tipo. Requieren muchos recursos para su funcionamiento. No están al alcance de cualquiera.


Los Directorios

Una barata tecnología, que es ampliamente utilizada por la cantidad de programas scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento.

 


Los sistemas mixtos Buscador – Directorio

Además de tener características de buscadores, presentan las webs registradas en catálogos sobre contenidos. Informática, cultura, sociedad. Que a su vez se dividen en subsecciones.

 

Metabuscadores

En realidad, no son buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados.

No suelen ser bien vistos por los buscadores. Para utilizar los servicios gratuitos de un buscador de esta forma, es necesario pedir permiso. El motivo es el siguiente: El Buscador, pone el dinero para opera el servicio, los contenidos que utilizará el metabuscador, y no percibe nada a cambio. Al eliminar la publicidad, no se obtienen ingresos. Solo gasto y pérdida de visitantes que utilicen este servicio de búsqueda.

 

Multibuscadores

Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores.

 

FFA Enlaces gratuitos para todos

FFA, página de enlaces gratuitos para todos. Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios. Los enlaces, no son permanentes.

 

Buscadores de Portal

Bajo este título, englobamos los buscadores específicos de sitio. Aquellos que buscan información solo en su portal o sitio web. Podríamos considerarlos como un directorio.

 

Palabras Clave

 

Tener claro el concepto de palabra clave, es fundamental para lograr una buena posición dentro de los buscadores. Los buscadores y algunos directorios de búsqueda utilizan las palabras clave que se ingresan para localizar los enlaces dentro de su base de datos y presentarlos como resultados. Estos resultados aparecen listados en páginas que contienen 10, 15 o 20 de estos enlaces. Esta forma de presentación varía de acuerdo a cada Buscador. El quedar colocado entre los primeros significa una correcta utilización de las etiquetas (metatags). Esto significa que nuestro título (title), descripción (description) y palabras clave (keywords) deben contener la información más apropiada y contundente relacionada con nuestro sitio Web.

 

 Sugerencias para elegir las palabras clave

 

Operadores Boleanos

 

La lógica proposicional utiliza los operadores lógicos para admitir o rechazar proposiciones. Un operador lógico es un estado en la lógica proposicional que puede tomar solamente dos estados: verdadero y falso. Es el Álgebra de Boole para el razonamiento lógico aristotélico moderno. Los operadores de proximidad: cerca y junto, trabajan con los operadores lógicos para motores de búsqueda en bases de datos.

Algunos Buscadores o Directorios de Búsqueda permiten crear búsquedas más potentes mediante las herramientas denominadas operadores booleanos que influyen en la forma en el software evalúa su consulta.

 

Usos de AND(y), OR(o) o NOT(no)

AND (Y). Unir términos de búsqueda mediante el operador Y indica que usted desea localizar documentos que contengan cada término. Puede usarse junto con otros operadores para lograr una búsqueda más potente. También puede usarse el signo "+" justo delante de las palabras que desea incluir en sus resultados. Por ejemplo, "Larry +Curly +Moe."

 

OR (O). Use O cuando cualquiera de los términos de búsqueda unidos por el operador deba aparecer en los resultados. Al igual que Y, O puede utilizarse como un elemento para construir expresiones booleanas más complejas.

 

NOT (NO). Use el operador NO para excluir documentos no deseados cuando su búsqueda utilice un término habitualmente encontrado en conexión con un tema no relacionado. También puede usar el signo "-" justo delante de las palabras que desea excluir de su búsqueda.

 

Comillas " ". Escriba entre comillas un grupo de palabras y obtendrá una frase. Note que usar frases entrecomilladas en conjunción con operadores booleanos ofrece más flexibilidad.

 

Localice relaciones con ADJ, NEAR, FAR y BEFORE

Con frecuencia, la situación de las palabras dentro de un documento revela su relevancia las unas con respecto a las otras. Algunos Buscadores o Directorios de Búsqueda, ofrecen cuatro operadores para definir esas relaciones: ADJ (adyacente), NEAR (cerca), FAR (lejos) y BEFORE (antes).

 

ADJ. Utilice el operador ADJ cuando desee encontrar documentos en los que aparezcan los términos juntos, sea en el orden que sea. Los aficionados a los deportes pueden buscar coches ADJ carreras sabiendo que tal búsqueda localizará tanto carreras de coches como coches de carreras.

 

NEAR. Cuando utilice NEAR, los términos deben aparecer en las 25 palabras próximas en los documentos de resultados. De esta manera, si busca "Kevin Bacon" NEAR game, encontrará páginas web referidas a un popular pasatiempo de tipo 'trivial' sin necesidad de ser tan excluyente como buscando por "Kevin Bacon juego".

 

FAR. Como se habrá imaginado, FAR es lo contrario de NEAR. Cuando utiliza FAR, se localizan documentos en los que los términos de la búsqueda aparecen con 25 palabras o más de distancia al menos en un caso. Como esto no elimina la posibilidad de que los términos aparezcan también más cerca dentro de la misma página, FAR es más útil cuando se usa en conjunción con otras expresiones.

 

BEFORE. Funciona como el conocido Y, siendo su única diferencia que los términos deben aparecer en el orden que usted especifique, pero pueden encontrarse a cualquier distancia en el mismo documento. Si no está seguro de cómo se escribe Gettysburg, puede hallar el texto del famoso discurso del presidente de Estados Unidos Abraham Lincoln en aquella ciudad escribiendo lo siguiente: fourscore BEFORE liberty.

 

 

 

Principales buscadores

De acuerdo con el estudio realizado por cyberatlas en el año 2001, los motores de búsquedas mas usados fueron los siguientes

Ranking.

Motor de Búsqueda

Usuarios/dia

1.

yahoo.com

64,407

2.

aol.com

53,101

3.

msn.com

47,809

4.

lycos.com

24,294

5.

nbci.com

19,776

6.

netscape.com

18,832

7.

excite.com

18,090

8.

ask.com

17,624

9.

altavista.com

15,785

10.

looksmart.com

15,396

11.

about.com

14,240

12.

go.com

13,190

13.

google.com

12,271

14.

goto.com

11,634

15.

msnbc.com

11,535

 

Fuente: cyberatlas.internet.com (Top Sites January 2001) Solo se cuenta cada usuario una vez al día, independientemente del numero de veces que accese o consulte al motor de búsqueda

 

Pero una investigación mas reciente revela que sin duda alguna el motor más utilizado en todo el mundo es Google. Este buscador se distingue entre los demás por la calidad y velocidad en mostrar los resultados. La competencia hará probablemente que las estadísticas vayan cambiando, pero se cree que le quedarán algunos años siendo el número uno.

 

 

Porcentaje de visitantes en Abril-Mayo 2004

 


Principales Motores de Búsqueda Venezolanos

 

Ranking.

Motor de Búsqueda

1.

terra.com.ve

2.

auyantepuy.com

3.

lycos.com.ve

4.

cantv.net

5.

venezuelavirtual.com

6.

trompo.com

7.

venezuelaonline.com

8.

venezuelavirtual.com

 

Fuente: Ing. Roberto Piol: Avalúo de Páginas Web (Website Aprraisal)

 

 

La ingente cantidad de información que anda dispersa por la Red serviría de bien poco si no fuéramos capaces de localizarla. Desde los albores de Internet los índices y motores de búsqueda han sido una herramienta imprescindible para recuperar la información, pero la situación en este sector ha variado mucho en los últimos tiempos.

Los nuevos motores de búsqueda son más potentes y albergan muchas más páginas web en sus bases de datos. La clásica distinción entre buscadores, arañas (robots que rastrean la Red para indexar páginas) y directorios (clasificaciones confeccionadas por humanos), se ha disipado. Ahora prácticamente todos añaden al cajetín de búsqueda un índice de contenidos basado habitualmente en el Open Directory Project (un proyecto colaborativo para construir un gran listado de enlaces seleccionados por voluntarios), aunque algunos mantienen directorios organizados según criterios propios.

En un buscador hay dos factores importantes a valorar:

Evidentemente, a los usuarios no les gusta nada descubrir que los resultados de búsqueda están determinados por el precio pagado. Así lo demuestra un reciente estudio de Consumer WebWatch, que revela que los internautas no conocen el funcionamiento de los buscadores y pierden confianza en ellos cuando descubren que incluyen resultados comprados por los anunciantes:

El panorama de los buscadores ha cambiado rápidamente en pocos años. Si antes Yahoo! y AltaVista se disputaban el favor de los usuarios, con una buena cohorte de motores de búsqueda abriéndose camino, ahora los internautas tienen un claro favorito, Google, que merece un capítulo a parte. Sin embargo, tras sus recientes adquisiciones, Yahoo! pretende seguir sus pasos.

Buscadores inteligentes

La empresa Intag (Intelligent Agents Internet Corp.) de Estados Unidos y la Universidad Caece de Buenos Aires presentaron el primer prototipo de "Mapa de Conocimiento Humano", que recopila el conocimiento sobre informática, computación y telecomunicaciones que hay en Internet. Se trata de un mapa "inteligente" que fue desarrollado utilizando la tecnología de la empresa denominada FIRST (Full Information Retrieval System Thesaurus), un sistema que permite buscar, incorporar y desechar contenido de Internet según los patrones de comportamiento e interés de sus usuarios de forma autónoma y casi sin intervención humana.

Lo de "inteligente" se debe al hecho de que el sistema tiene "capacidad auto evolutiva y es capaz de aprender tanto como sea posible de sus usuarios, detectando y clasificando sus patrones de conducta", según informan en el sitio. "Así, clones de este prototipo hospedados en cualquier sitio Web se adaptan en forma continua y automática a las necesidades de sus usuarios, ya que reconocen sus pautas de conducta", agregan en la Universidad.

El ingeniero argentino Juan Chamero, define al "mapa" como un sistema informático "con agentes inteligentes de búsqueda a los que se les da instrucciones precisas para encontrar datos sobre temas específicos en la web".

 

 

Infografías

 

1.     Autor: Buscaportal.com

Contenido: Portal que incluye información relevante sobre las formas de buscar información en Internet, motores de búsqueda, tipos de motores, resultados de búsquedas, búsqueda avanzada de datos, entre otros.

URL http://www.buscarportal.com/articulos/buscar.php

 

2.     Autor: Adrian Hall/Nº 1 en Buscadores

Contenido: Definición de buscadores, directorios y portales

URL http://www.1-en-buscadores.com/buscadores.html

 

3.     Autor/Título: Ing. Roberto Piol /Avalúo de páginas Web (Website Appraisal)

Contenido: Trabajo en el que presenta un Modelo de Valoración de Páginas Web (Website Appraisal), analizando desde las características de su Dominio hasta los costos de Diseño, Alojamiento y Mantenimiento de la misma. De éste se extrae datos sobre el la lista de los 15 buscadores mas utilizados en el año 2001.

URL: http://www.gestiopolis.com/recursos/documentos/fulldocs/ger/avalpagweb.htm

 

4.     Autor/Título: Héctor Fernández para Wikipedia, La Enciclopedia Libre: Tipos de Motores de Búsqueda

Contenido: El autor presenta en su escrito los diferentes tipos de buscadores definiendo sus principales características.

URL: http://es.wikipedia.org/wiki/Motor_de_búsqueda

 

5.     Autor/Título: J.C. Daccach: Álgebra Booleana Básica

Contenido: El autor presenta un conjunto de recomendaciones para optimizar la búsqueda el Internet a través del uso de operadores booleanos.

URL: http://www.buscarportal.com/articulos/motores_busqueda.php

 

6.     Autor/Título: Nacho Rojo para Consumer.es/Fundación Eroski: La Internet Invisible

Contenido: El reportaje refiere la existencia de una gran cantidad de información en Internet que no esta al alcance de los buscadores, a la cual el autor denomina “Red Invisible” que se encuentra en bases de datos especializadas.

URL http://www.consumer.es/web/es/tecnologia/internet/2004/11/04/111386.php?print=true

 

7.     Autor/Título: StudioHz.com/Google y … Los Otros?

Contenido Artículo que muestra las bondades y preferencias de los internautas en el uso de este potente buscador. Además presenta algunos problemas derivados         de las últimas actualizaciones.

URL:  http://www.studiohz.com/articulos_internet.asp?id=31

 

8.     Autor: ISOBAR-AEGIS MEDIA

Contenido: Este artículo de ntbuscadores, presenta la importancia que tiene para su empresa el promocionarse y promocionarse en buscadores de Internet

URL:  http://www.ntbuscadores.com/web-marketing-sem.asp

 

9.     Autor/Título: Preguntas mas frecuentes sobre Darwin: Intelligent Website

Contenido: Página donde se presenta información acerca del Prototipo de Mapa de conocimiento humano desarrollado con tecnologías FIRST, por la empresa Intag (Intelligent Agents Internet Corp.) de Estados Unidos y la Universidad Caece de Buenos Aires.

 URL http://www.intag.org/pages/faq/