Universidad Yacambú
Dirección de Estudios
Virtuales
Asignatura: Gerencia del
Conocimiento
Prof. Javier Carnevali
Elaborado por Maricel Bruce D’Viazzo
Equipo Nº
2
Trabajo Nº
2
Buscadores
Acceso Página del Grupo:
http://es.geocities.co
m/alexi_arias/gdc/T2.HTM
Hoy
en día se utiliza esta palabra para referirse a cualquier sitio web cuya función
de localizar otras direcciones sea más importante que sus propios contenidos.
Sin embargo, a la luz de algunos entendidos en la materia, esta definición es
poco satisfactoria ya que hay muchos lugares donde buscar y muchas maneras de
realizar la búsqueda.
Un
motor de búsqueda es un software
que realiza búsquedas de archivos almacenados en los ordenadores, un ejemplo son
los buscadores de Internet (algunos buscan sólo en la Web pero otros
buscan además en News, Gopher, FTP, etc.) cuando les pedimos información sobre
algún tema. Las búsquedas se hacen con palabras clave y/o con árboles
jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones
Web en los que se mencionan temas relacionados con las palabras clave
buscadas.
Como
operan en forma automática, los motores de búsqueda contienen generalmente más
información que los directorios. Sin embargo, estos últimos también han de
construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos
dados por los creadores de páginas (lo cual puede ser muy limitativo). Los
buenos directorios combinan ambos sistemas.
Definición
de Buscadores
Los
buscadores son programas que permiten hacer búsquedas entre archivos y páginas
web en Internet. Las búsquedas son resultados de la base de datos de estos
buscadores. Su función principal es mostrar los resultados que tienen más
relación con el término o la frase de búsqueda que
utilizamos.
Existen
varios tipos de buscadores:
·
Buscadores
de Archivos,
que sirven para buscar archivos en Internet,
·
Buscadores
de Webs que
buscan páginas web en Internet.
·
Buscadores
temáticos,
que buscan webs sobre algún tema en concreto,
·
Buscadores
genéricos
que buscan cualquier tipo web en Internet. Son los más utilizados y pueden
aportar muchas visitas. Muchos de estos motores de búsqueda también incluyen
documentos en sus resultados.
Un
buscador es un programa que periódicamente analiza y valora los contenidos de
las páginas de su índice y aplica un algoritmo para emparejar estas páginas con
las búsquedas de sus usuarios. No hay intervención humana ni en el análisis o
valoración de la página, ni en la construcción de los resultados de búsqueda
para lo cual cuentan con robots que se encargan de seguir los enlaces de la WWW
visitando nuevas páginas y actualizando su base de datos.
Indexamiento
y motores de búsqueda
Indexamiento
es la capacidad de tomar un documento y separarlo en temas relevantes, esta es
la mayor función que cubre un motor de búsqueda que posteriormente almacena los
resultados para ser llamados cuando una búsqueda referente al tema se realiza.
Robots de Busqueda
Un
robot es un programa que atraviesa una estructura de hipertexto recuperando ese
enlace y todos los enlaces que están referenciados allí. De ello se alimentan
los grandes motores de búsqueda de la web.
La
diferencia con los Directorios, es que éstos no poseen robots, están operados
por humanos y no recuperan automáticamente los enlaces incluidos en las páginas
web, sino que sólo se limitan a hallar lo que las personas manualmente incluyen
en ellos, pudiendo como ventaja clasificar por secciones la temática de las web
al hacer el proceso manual.
Los robots son usualmente llamados "Web
Wanderers", "Web Crawlers", o "Spiders" (arañas de búsqueda) y se suele imaginar
que se mueven entre los sitios como si fuesen virus, este no es el caso, un
robot simplemente visita los sitios y extrae los enlaces que están incluidos
dentro de estos.
Arañas
(Spiders)
Es un robot, pero otorga resultados más fríos.
Gusanos
(Worms)
Es lo mismo que un robot, aunque técnicamente un gusano es una
réplica de un programa, a diferencia de un robot que es un programa original.
Orugas
(Web crawlers)
Es lo mismo que un robot, pero hay que aclarar que es un tipo
específico de robot.
Hormigas
(WebAnts)
Cooperativa de robots
Qué
es un Agente:
La palabra "Agente" tiene muchos significados en el mundo de la computación
de nuestros días. Específicamente:
Diferencias
entre Buscador con y sin robot
Buscador
sin robot:
Las
direcciones añadidas, se ubican en secciones dentro de una estructura de árbol,
debiéndose indicar la/s categorías bajo las que se desea queden ubicadas en el
proceso de alta.
Los
contenidos, en muchos casos, son analizados y procesados por personas que
visitarán la dirección añadida, determinando si éste cumple con los requisitos
necesarios para ser dado de alta y si los datos introducidos son correctos.
Es
imprescindible dar el alta manual de su sitio Web para figurar dentro de la base
de datos de los directorios.
Para
lograr una buena posición normalmente no es necesario el uso de palabras clave.
Usualmente es suficiente con que el título del sitio comience con la letra más
cercana a la A en el alfabeto o por alguno de los primeros caracteres de la
codificación ASCII.
Hay
menos resultados totales debido al menor contenido de sus bases de datos. Estos
son mejores, más fiables y presentan menos enlaces erróneos o poco efectivos.
Los
resultados aparecen por orden alfabético en la mayoría de los casos y ordenados
por categorías temáticas.
Las
altas demoran entre 2 a 4 días. Salvo excepciones en que por las características
del directorio, llegan a las 2 a 8 semanas en producirse.
Son
ideales para hallar páginas sencillas con temas comunes, pues las búsquedas se
facilitan.
Buscador
con robot:
Los
contenidos son indexados por medio de un robot, araña o gusano.
No
es imprescindible dar el alta a un sitio web para figurar en él. Es aconsejable
pero no imprescindible, pues la mayoría de los robots buscan por la web por
ellos mismos, indexando todo lo que hallan a su paso. Aun así, el contenido de
sus bases de datos no suele superar el 5% del total de la red.
Para
lograr una buena posición es necesario el correcto uso de palabras clave y
etiquetas dentro del código HTML.
Hay
más resultados totales, estos son menos fiables y presentan más enlaces erróneos
o poco efectivos.
Los
resultados aparecen por orden de popularidad, dependiendo de las características
del robot. Puede tomar las palabras clave del título, descripción o contenido.
Las
altas pueden llegar a demorar varios meses en algunos casos.
Son
ideales para hallar temas intrincados o prohibidos en los directorios de
búsqueda, o para encontrar temas poco comunes.
Clases
de buscadores
Los
Spiders
La
mayoría de grandes buscadores internacionales que todos usamos y conocemos son
de este tipo. Requieren muchos recursos para su funcionamiento. No están al
alcance de cualquiera.
Los
Directorios
Una
barata tecnología, que es ampliamente utilizada por la cantidad de programas
scripts en el mercado. No se requieren muchos recursos de informática. En
cambio, se requiere más soporte humano y mantenimiento.
Los
sistemas mixtos Buscador – Directorio
Además
de tener características de buscadores, presentan las webs registradas en
catálogos sobre contenidos. Informática, cultura, sociedad. Que a su vez se
dividen en subsecciones.
Metabuscadores
En
realidad, no son buscadores. Lo que hacen, es realizar búsquedas en auténticos
buscadores, analizan los resultados de la página, y presentan sus propios
resultados.
No
suelen ser bien vistos por los buscadores. Para utilizar los servicios gratuitos
de un buscador de esta forma, es necesario pedir permiso. El motivo es el
siguiente: El Buscador, pone el dinero para opera el servicio, los contenidos
que utilizará el metabuscador, y no percibe nada a cambio. Al eliminar la
publicidad, no se obtienen ingresos. Solo gasto y pérdida de visitantes que
utilicen este servicio de búsqueda.
Multibuscadores
Permite
lanzar varias búsquedas en motores seleccionados respetando el formato original
de los buscadores.
FFA
Enlaces gratuitos para todos
FFA,
página de enlaces gratuitos para todos. Cualquiera puede inscribir su página
durante un tiempo limitado en estos pequeños directorios. Los enlaces, no son
permanentes.
Buscadores
de Portal
Bajo
este título, englobamos los buscadores específicos de sitio. Aquellos que buscan
información solo en su portal o sitio web. Podríamos considerarlos como un
directorio.
Palabras
Clave
Tener claro el concepto de
palabra clave, es fundamental para lograr una buena posición dentro de los
buscadores. Los buscadores y algunos directorios de búsqueda utilizan las
palabras clave que se ingresan para localizar los enlaces dentro de su base de
datos y presentarlos como resultados. Estos resultados aparecen listados en
páginas que contienen 10, 15 o 20 de estos enlaces. Esta forma de presentación
varía de acuerdo a cada Buscador. El quedar colocado entre los primeros
significa una correcta utilización de las etiquetas (metatags). Esto significa
que nuestro título (title), descripción (description) y palabras clave
(keywords) deben contener la información más apropiada y contundente relacionada
con nuestro sitio Web.
Sugerencias para elegir las palabras
clave |
Operadores
Boleanos
La
lógica proposicional utiliza los operadores lógicos para admitir o rechazar
proposiciones. Un operador lógico es un estado en la lógica proposicional que
puede tomar solamente dos estados: verdadero y falso. Es el Álgebra de Boole
para el razonamiento lógico aristotélico moderno. Los operadores de proximidad:
cerca y junto, trabajan con los operadores lógicos para motores de búsqueda en
bases de datos.
Algunos
Buscadores o Directorios de Búsqueda permiten crear búsquedas más potentes
mediante las herramientas denominadas operadores booleanos que influyen en la
forma en el software evalúa su consulta.
Usos
de AND(y), OR(o) o NOT(no)
AND
(Y). Unir términos de búsqueda mediante el operador Y indica que usted
desea localizar documentos que contengan cada término. Puede usarse junto con
otros operadores para lograr una búsqueda más potente. También puede usarse el
signo "+" justo delante de las palabras que desea incluir en sus resultados. Por
ejemplo, "Larry +Curly
+Moe."
OR
(O). Use O cuando cualquiera de los términos de búsqueda unidos por el
operador deba aparecer en los resultados. Al igual que Y, O puede utilizarse
como un elemento para construir expresiones booleanas más complejas.
NOT
(NO). Use el operador NO para excluir documentos no deseados cuando su
búsqueda utilice un término habitualmente encontrado en conexión con un tema no
relacionado. También puede usar el signo "-" justo delante de las palabras que
desea excluir de su búsqueda.
Comillas
" ".
Escriba entre comillas un grupo de palabras y obtendrá una frase. Note que usar
frases entrecomilladas en conjunción con operadores booleanos ofrece más
flexibilidad.
Localice
relaciones con
ADJ, NEAR, FAR y BEFORE
Con
frecuencia, la situación de las palabras dentro de un documento revela su
relevancia las unas con respecto a las otras. Algunos Buscadores o Directorios
de Búsqueda, ofrecen cuatro operadores para definir esas relaciones: ADJ
(adyacente), NEAR (cerca), FAR (lejos) y BEFORE (antes).
ADJ.
Utilice el operador ADJ cuando desee encontrar documentos en los que
aparezcan los términos juntos, sea en el orden que sea. Los aficionados a los
deportes pueden buscar coches ADJ carreras sabiendo que tal
búsqueda localizará tanto carreras de coches como coches de carreras.
NEAR.
Cuando utilice NEAR, los términos deben aparecer en las 25 palabras
próximas en los documentos de resultados. De esta manera, si busca "Kevin
Bacon" NEAR game, encontrará páginas web referidas a un popular
pasatiempo de tipo 'trivial' sin necesidad de ser tan excluyente como buscando
por "Kevin Bacon juego".
FAR.
Como se habrá imaginado, FAR es lo contrario de NEAR. Cuando
utiliza FAR, se localizan documentos en los que los términos de la
búsqueda aparecen con 25 palabras o más de distancia al menos en un caso. Como
esto no elimina la posibilidad de que los términos aparezcan también más cerca
dentro de la misma página, FAR es más útil cuando se usa en conjunción
con otras expresiones.
BEFORE.
Funciona como el conocido Y, siendo su única diferencia que los términos deben
aparecer en el orden que usted especifique, pero pueden encontrarse a cualquier
distancia en el mismo documento. Si no está seguro de cómo se escribe
Gettysburg, puede hallar el texto del famoso discurso del presidente de Estados
Unidos Abraham Lincoln en aquella ciudad escribiendo lo siguiente: fourscore
BEFORE liberty.
Principales
buscadores
De
acuerdo con el estudio realizado por cyberatlas en el
año 2001, los motores de búsquedas mas usados fueron los
siguientes
Ranking.
|
Motor
de Búsqueda |
Usuarios/dia |
1. |
yahoo.com |
64,407 |
2. |
aol.com |
53,101
|
3.
|
msn.com
|
47,809
|
4.
|
lycos.com
|
24,294
|
5.
|
nbci.com
|
19,776
|
6.
|
netscape.com
|
18,832
|
7.
|
excite.com
|
18,090
|
8.
|
ask.com
|
17,624
|
9.
|
altavista.com
|
15,785
|
10.
|
looksmart.com
|
15,396
|
11.
|
about.com
|
14,240
|
12.
|
go.com
|
13,190
|
13.
|
google.com
|
12,271
|
14.
|
goto.com
|
11,634
|
15.
|
msnbc.com
|
11,535
|
Fuente:
cyberatlas.internet.com (Top Sites January 2001) Solo se cuenta
cada usuario una vez al día, independientemente del numero de veces que accese o consulte al motor de búsqueda
Pero
una investigación mas reciente revela que sin duda
alguna el motor más utilizado en todo el mundo es Google. Este buscador se
distingue entre los demás por la calidad y velocidad en mostrar los resultados.
La competencia hará probablemente que las estadísticas vayan cambiando, pero se
cree que le quedarán algunos años siendo el número uno.
Porcentaje
de visitantes en Abril-Mayo 2004
Principales
Motores de Búsqueda Venezolanos
Ranking. |
Motor
de Búsqueda |
1. |
terra.com.ve |
2.
|
auyantepuy.com
|
3.
|
lycos.com.ve
|
4.
|
cantv.net
|
5.
|
venezuelavirtual.com
|
6.
|
trompo.com
|
7.
|
venezuelaonline.com
|
8.
|
venezuelavirtual.com |
Fuente:
Ing. Roberto Piol: Avalúo de Páginas Web (Website
Aprraisal)
La
ingente cantidad de información que anda dispersa por la Red serviría de bien
poco si no fuéramos capaces de localizarla. Desde los albores de Internet los
índices y motores de búsqueda han sido una herramienta imprescindible para
recuperar la información, pero la situación en este sector ha variado mucho en
los últimos tiempos.
Los nuevos motores
de búsqueda son más potentes y albergan muchas más páginas web en sus bases de
datos. La clásica distinción entre buscadores, arañas (robots que rastrean la
Red para indexar páginas) y directorios (clasificaciones confeccionadas por
humanos), se ha disipado. Ahora prácticamente todos añaden al cajetín de
búsqueda un índice de contenidos basado habitualmente en el Open Directory
Project (un proyecto colaborativo para construir un gran listado de enlaces
seleccionados por voluntarios), aunque algunos mantienen directorios organizados
según criterios propios.
En un buscador hay
dos factores importantes a valorar:
Evidentemente, a
los usuarios no les gusta nada descubrir que los resultados de búsqueda están
determinados por el precio pagado. Así lo demuestra un reciente estudio de
Consumer WebWatch, que revela que los internautas no conocen el funcionamiento
de los buscadores y pierden confianza en ellos cuando descubren que incluyen
resultados comprados por los anunciantes:
El panorama de los
buscadores ha cambiado rápidamente en pocos años. Si antes Yahoo! y AltaVista se
disputaban el favor de los usuarios, con una buena cohorte de motores de
búsqueda abriéndose camino, ahora los internautas tienen un claro favorito,
Google, que merece un capítulo a parte. Sin embargo, tras sus recientes
adquisiciones, Yahoo! pretende seguir sus pasos.
Buscadores
inteligentes
La empresa Intag
(Intelligent Agents Internet Corp.) de Estados Unidos y la Universidad Caece de
Buenos Aires presentaron el primer prototipo de "Mapa de Conocimiento Humano",
que recopila el conocimiento sobre informática, computación y telecomunicaciones
que hay en Internet. Se trata de un mapa "inteligente" que fue desarrollado
utilizando la tecnología de la empresa denominada FIRST (Full Information
Retrieval System Thesaurus), un sistema que permite buscar, incorporar y
desechar contenido de Internet según los patrones de comportamiento e interés de
sus usuarios de forma autónoma y casi sin intervención humana.
Lo de "inteligente" se debe
al hecho de que el sistema tiene "capacidad auto evolutiva y es capaz de
aprender tanto como sea posible de sus usuarios, detectando y clasificando sus
patrones de conducta", según informan en el sitio. "Así, clones de este
prototipo hospedados en cualquier sitio Web se adaptan en forma continua y
automática a las necesidades de sus usuarios, ya que reconocen sus pautas de
conducta", agregan en la Universidad.
El ingeniero argentino Juan
Chamero, define al "mapa" como un sistema informático "con agentes inteligentes
de búsqueda a los que se les da instrucciones precisas para encontrar datos
sobre temas específicos en la web".
Infografías
1.
Autor:
Buscaportal.com
Contenido:
Portal
que incluye información relevante sobre las formas de buscar información en
Internet, motores de búsqueda, tipos de motores, resultados de búsquedas,
búsqueda avanzada de datos, entre otros.
URL
http://www.buscarportal.com/articulos/buscar.php
2.
Autor:
Adrian
Hall/Nº 1 en Buscadores
Contenido:
Definición
de buscadores, directorios y portales
URL
http://www.1-en-buscadores.com/buscadores.html
3.
Autor/Título:
Ing.
Roberto Piol /Avalúo de páginas Web (Website Appraisal)
Contenido:
Trabajo
en el que presenta un Modelo de Valoración de Páginas Web (Website Appraisal),
analizando desde las características de su Dominio hasta los costos de Diseño,
Alojamiento y Mantenimiento de la misma. De éste se extrae datos sobre el la
lista de los 15 buscadores mas utilizados en el año
2001.
URL:
http://www.gestiopolis.com/recursos/documentos/fulldocs/ger/avalpagweb.htm
4.
Autor/Título:
Héctor
Fernández para Wikipedia, La Enciclopedia Libre:
Tipos de Motores de
Búsqueda
Contenido:
El autor presenta en su escrito los
diferentes tipos de buscadores definiendo sus principales características.
URL: http://es.wikipedia.org/wiki/Motor_de_búsqueda
5.
Autor/Título:
J.C.
Daccach:
Álgebra Booleana Básica
Contenido:
El autor presenta un conjunto de
recomendaciones para optimizar la búsqueda el Internet a través del uso de
operadores booleanos.
URL: http://www.buscarportal.com/articulos/motores_busqueda.php
6.
Autor/Título:
Nacho Rojo para Consumer.es/Fundación
Eroski: La Internet
Invisible
Contenido:
El reportaje refiere la existencia de una
gran cantidad de información en Internet que no esta al alcance de los
buscadores, a la cual el autor denomina “Red Invisible” que se encuentra en
bases de datos especializadas.
URL http://www.consumer.es/web/es/tecnologia/internet/2004/11/04/111386.php?print=true
7.
Autor/Título:
StudioHz.com/Google y … Los
Otros?
Contenido
Artículo
que muestra las bondades y preferencias de los internautas en el uso de este
potente buscador. Además presenta algunos problemas derivados de las
últimas actualizaciones.
URL:
http://www.studiohz.com/articulos_internet.asp?id=31
8.
Autor:
ISOBAR-AEGIS
MEDIA
Contenido:
Este artículo de ntbuscadores, presenta la importancia que tiene para su empresa
el promocionarse y promocionarse en buscadores de
Internet
URL:
http://www.ntbuscadores.com/web-marketing-sem.asp
9.
Autor/Título:
Preguntas mas frecuentes sobre Darwin: Intelligent Website
Contenido:
Página donde se presenta información
acerca del Prototipo de Mapa de conocimiento humano desarrollado con tecnologías
FIRST, por la empresa Intag (Intelligent
Agents Internet Corp.) de Estados Unidos y la Universidad Caece de Buenos
Aires.
URL http://www.intag.org/pages/faq/