Universidad Yacambú
Dirección de Estudios
Virtuales
Asignatura: Gerencia del
Conocimiento
Prof. Javier Carnevali
Equipo Nº 2
Trabajo Nº 2
Buscadores
Hoy en día se utiliza esta palabra para referirse a
cualquier sitio web cuya función de localizar otras direcciones sea más
importante que sus propios contenidos. Sin embargo, a la luz de algunos
entendidos en la materia, esta definición es poco satisfactoria ya que hay
muchos lugares donde buscar y muchas maneras de realizar la búsqueda.
Un motor de
búsqueda es un software que realiza búsquedas de archivos almacenados en
los ordenadores, un ejemplo son los buscadores de Internet (algunos
buscan sólo en la Web pero otros buscan además en News, Gopher, FTP, etc.) cuando
les pedimos información sobre algún tema. Las búsquedas se hacen con palabras
clave y/o con árboles jerárquicos por temas; el resultado de la búsqueda es un
listado de direcciones Web en los que se mencionan temas relacionados con las
palabras clave buscadas.
Como operan en forma automática, los motores de búsqueda
contienen generalmente más información que los directorios. Sin embargo, estos
últimos también han de construirse a partir de búsquedas (no automatizadas) o
bien a partir de avisos dados por los creadores de páginas (lo cual puede ser
muy limitativo). Los buenos directorios combinan ambos sistemas.
Definición de Buscadores
Los buscadores son programas
que permiten hacer búsquedas entre archivos y páginas web en Internet. Las
búsquedas son resultados de la base de datos de estos buscadores. Su función
principal es mostrar los resultados que tienen más relación con el término o la
frase de búsqueda que utilizamos.
Existen varios tipos de buscadores:
·
Buscadores
de Archivos, que sirven para buscar
archivos en Internet,
·
Buscadores
de Webs que buscan páginas web en
Internet.
·
Buscadores temáticos, que buscan webs sobre algún tema en concreto,
·
Buscadores genéricos que buscan cualquier tipo web en Internet. Son los más
utilizados y pueden aportar muchas visitas. Muchos de estos motores de búsqueda
también incluyen documentos en sus resultados.
Un buscador es un programa que
periódicamente analiza y valora los contenidos de las páginas de su índice y
aplica un algoritmo para emparejar estas páginas con las búsquedas de sus
usuarios. No hay intervención humana ni en el análisis o valoración de la
página, ni en la construcción de los resultados de búsqueda para lo cual
cuentan con robots que se encargan de seguir los enlaces de la WWW visitando
nuevas páginas y actualizando su base de datos.
Indexamiento y motores de búsqueda
Indexamiento es la
capacidad de tomar un documento y separarlo en temas relevantes, esta es la
mayor función que cubre un motor de búsqueda que posteriormente almacena los
resultados para ser llamados cuando una búsqueda referente al tema se realiza.
Robots de Busqueda
Un robot es un programa que atraviesa una estructura de
hipertexto recuperando ese enlace y todos los enlaces que están referenciados
allí. De ello se alimentan los grandes motores de búsqueda de la web.
La diferencia con los Directorios, es que éstos no poseen
robots, están operados por humanos y no recuperan automáticamente los enlaces
incluidos en las páginas web, sino que sólo se limitan a hallar lo que las
personas manualmente incluyen en ellos, pudiendo como ventaja clasificar por
secciones la temática de las web al hacer el proceso manual.
Los robots son usualmente llamados "Web Wanderers", "Web
Crawlers", o "Spiders" (arañas de búsqueda) y se suele imaginar
que se mueven entre los sitios como si fuesen virus, este no es el caso, un
robot simplemente visita los sitios y extrae los enlaces que están incluidos
dentro de estos.
Arañas (Spiders)
Es un robot, pero otorga resultados más fríos.
Gusanos (Worms)
Es lo mismo que un robot, aunque técnicamente un gusano es una réplica de un
programa, a diferencia de un robot que es un programa original.
Orugas (Web crawlers)
Es lo mismo que un robot, pero hay que aclarar que es un tipo específico de
robot.
Hormigas
(WebAnts)
Cooperativa de robots
Qué es un Agente:
La palabra "Agente" tiene muchos significados en el mundo de la
computación de nuestros días. Específicamente:
Diferencias entre Buscador con y sin robot
Buscador sin robot:
Las direcciones añadidas, se
ubican en secciones dentro de una estructura de árbol, debiéndose indicar la/s
categorías bajo las que se desea queden ubicadas en el proceso de alta.
Los contenidos, en muchos
casos, son analizados y procesados por personas que visitarán la dirección
añadida, determinando si éste cumple con los requisitos necesarios para ser
dado de alta y si los datos introducidos son correctos.
Es imprescindible dar el alta
manual de su sitio Web para figurar dentro de la base de datos de los
directorios.
Para lograr una buena posición
normalmente no es necesario el uso de palabras clave. Usualmente es suficiente
con que el título del sitio comience con la letra más cercana a la A en el
alfabeto o por alguno de los primeros caracteres de la codificación ASCII.
Hay menos resultados totales
debido al menor contenido de sus bases de datos. Estos son mejores, más fiables
y presentan menos enlaces erróneos o poco efectivos.
Los resultados aparecen por
orden alfabético en la mayoría de los casos y ordenados por categorías
temáticas.
Las altas demoran entre 2 a 4
días. Salvo excepciones en que por las características del directorio, llegan a
las 2 a 8 semanas en producirse.
Son ideales para hallar
páginas sencillas con temas comunes, pues las búsquedas se facilitan.
Buscador con robot:
Los contenidos son indexados
por medio de un robot, araña o gusano.
No es imprescindible dar el
alta a un sitio web para figurar en él. Es aconsejable pero no imprescindible,
pues la mayoría de los robots buscan por la web por ellos mismos, indexando
todo lo que hallan a su paso. Aun así, el contenido de sus bases de datos no
suele superar el 5% del total de la red.
Para lograr una buena posición
es necesario el correcto uso de palabras clave y etiquetas dentro del código
HTML.
Hay más resultados totales,
estos son menos fiables y presentan más enlaces erróneos o poco efectivos.
Los resultados aparecen por
orden de popularidad, dependiendo de las características del robot. Puede tomar
las palabras clave del título, descripción o contenido.
Las altas pueden llegar a
demorar varios meses en algunos casos.
Son ideales para hallar temas
intrincados o prohibidos en los directorios de búsqueda, o para encontrar temas
poco comunes.
Clases de buscadores
Los Spiders
La mayoría de grandes
buscadores internacionales que todos usamos y conocemos son de este tipo.
Requieren muchos recursos para su funcionamiento. No están al alcance de
cualquiera.
Los Directorios
Una barata tecnología, que es
ampliamente utilizada por la cantidad de programas scripts en el
mercado. No se requieren muchos recursos de informática. En cambio, se requiere
más soporte humano y mantenimiento.
Los sistemas mixtos Buscador – Directorio
Además de tener
características de buscadores, presentan las webs registradas en catálogos
sobre contenidos. Informática, cultura, sociedad. Que a su vez se dividen en
subsecciones.
Metabuscadores
En realidad, no son
buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores,
analizan los resultados de la página, y presentan sus propios resultados.
No suelen ser bien vistos por
los buscadores. Para utilizar los servicios gratuitos de un buscador de esta
forma, es necesario pedir permiso. El motivo es el siguiente: El Buscador, pone
el dinero para opera el servicio, los contenidos que utilizará el metabuscador,
y no percibe nada a cambio. Al eliminar la publicidad, no se obtienen ingresos.
Solo gasto y pérdida de visitantes que utilicen este servicio de búsqueda.
Multibuscadores
Permite lanzar varias
búsquedas en motores seleccionados respetando el formato original de los
buscadores.
FFA Enlaces gratuitos para todos
FFA, página de enlaces
gratuitos para todos. Cualquiera puede inscribir su página durante un tiempo
limitado en estos pequeños directorios. Los enlaces, no son permanentes.
Buscadores de Portal
Bajo este título, englobamos
los buscadores específicos de sitio. Aquellos que buscan información solo en su
portal o sitio web. Podríamos considerarlos como un directorio.
Palabras Clave
Tener
claro el concepto de palabra clave, es fundamental para lograr una buena
posición dentro de los buscadores. Los buscadores y algunos directorios de
búsqueda utilizan las palabras clave que se ingresan para localizar los enlaces
dentro de su base de datos y presentarlos como resultados. Estos resultados
aparecen listados en páginas que contienen 10, 15 o 20 de estos enlaces. Esta
forma de presentación varía de acuerdo a cada Buscador. El quedar colocado
entre los primeros significa una correcta utilización de las etiquetas
(metatags). Esto significa que nuestro título (title), descripción
(description) y palabras clave (keywords) deben contener la información más
apropiada y contundente relacionada con nuestro sitio Web.
Sugerencias para elegir las palabras
clave |
Operadores
Boleanos
La lógica proposicional
utiliza los operadores lógicos para admitir o rechazar proposiciones. Un
operador lógico es un estado en la lógica proposicional que puede tomar
solamente dos estados: verdadero y falso. Es el Álgebra de Boole para el
razonamiento lógico aristotélico moderno. Los operadores de proximidad: cerca y
junto, trabajan con los operadores lógicos para motores de búsqueda en bases de
datos.
Algunos Buscadores o
Directorios de Búsqueda permiten crear búsquedas más potentes mediante las
herramientas denominadas operadores booleanos que influyen en la forma en el
software evalúa su consulta.
Usos
de AND(y), OR(o) o NOT(no)
AND (Y). Unir términos de búsqueda mediante el operador Y
indica que usted desea localizar documentos que contengan cada término. Puede
usarse junto con otros operadores para lograr una búsqueda más potente. También
puede usarse el signo "+" justo delante de las palabras que desea
incluir en sus resultados. Por ejemplo, "Larry +Curly +Moe."
OR (O). Use O cuando cualquiera de los términos de
búsqueda unidos por el operador deba aparecer en los resultados. Al igual que
Y, O puede utilizarse como un elemento para construir expresiones booleanas más
complejas.
NOT (NO). Use el operador NO para excluir documentos
no deseados cuando su búsqueda utilice un término habitualmente encontrado en
conexión con un tema no relacionado. También puede usar el signo "-"
justo delante de las palabras que desea excluir de su búsqueda.
Comillas " ". Escriba entre comillas un grupo de palabras y obtendrá una
frase. Note que usar frases entrecomilladas en conjunción con operadores
booleanos ofrece más flexibilidad.
Localice
relaciones con ADJ, NEAR, FAR
y BEFORE
Con frecuencia, la situación
de las palabras dentro de un documento revela su relevancia las unas con
respecto a las otras. Algunos Buscadores o Directorios de Búsqueda, ofrecen
cuatro operadores para definir esas relaciones: ADJ (adyacente), NEAR
(cerca), FAR (lejos) y BEFORE (antes).
ADJ. Utilice el operador ADJ cuando desee encontrar
documentos en los que aparezcan los términos juntos, sea en el orden que sea.
Los aficionados a los deportes pueden buscar coches ADJ carreras sabiendo
que tal búsqueda localizará tanto carreras de coches como coches de carreras.
NEAR. Cuando utilice NEAR, los términos deben aparecer
en las 25 palabras próximas en los documentos de resultados. De esta manera, si
busca "Kevin Bacon" NEAR game, encontrará páginas web
referidas a un popular pasatiempo de tipo 'trivial' sin necesidad de ser tan
excluyente como buscando por "Kevin Bacon juego".
FAR. Como se habrá imaginado, FAR es lo contrario de NEAR.
Cuando utiliza FAR, se localizan documentos en los que los términos de
la búsqueda aparecen con 25 palabras o más de distancia al menos en un caso.
Como esto no elimina la posibilidad de que los términos aparezcan también más
cerca dentro de la misma página, FAR es más útil cuando se usa en
conjunción con otras expresiones.
BEFORE. Funciona como el conocido Y, siendo su única diferencia
que los términos deben aparecer en el orden que usted especifique, pero pueden
encontrarse a cualquier distancia en el mismo documento. Si no está seguro de
cómo se escribe Gettysburg, puede hallar el texto del famoso discurso del
presidente de Estados Unidos Abraham Lincoln en aquella ciudad escribiendo lo
siguiente: fourscore BEFORE liberty.
Principales buscadores
De acuerdo con el estudio
realizado por cyberatlas en el año 2001, los motores
de búsquedas mas usados fueron los siguientes
Ranking. |
Motor de Búsqueda |
Usuarios/dia |
1. |
yahoo.com |
64,407 |
2. |
aol.com |
53,101 |
3. |
msn.com |
47,809 |
4. |
lycos.com |
24,294 |
5. |
nbci.com |
19,776 |
6. |
netscape.com |
18,832 |
7. |
excite.com |
18,090 |
8. |
ask.com |
17,624 |
9. |
altavista.com |
15,785 |
10. |
looksmart.com |
15,396 |
11. |
about.com |
14,240 |
12. |
go.com |
13,190 |
13. |
google.com |
12,271 |
14. |
goto.com |
11,634 |
15. |
msnbc.com |
11,535 |
Fuente: cyberatlas.internet.com
(Top Sites January 2001) Solo se cuenta cada usuario una vez al día,
independientemente del numero de veces que accese o consulte
al motor de búsqueda
Pero una investigación mas reciente revela que sin duda alguna el motor más
utilizado en todo el mundo es Google. Este buscador se distingue entre los
demás por la calidad y velocidad en mostrar los resultados. La competencia hará
probablemente que las estadísticas vayan cambiando, pero se cree que le
quedarán algunos años siendo el número uno.
Porcentaje
de visitantes en Abril-Mayo 2004
Principales Motores de Búsqueda Venezolanos
Ranking. |
Motor de Búsqueda |
1. |
terra.com.ve |
2. |
auyantepuy.com |
3. |
lycos.com.ve |
4. |
cantv.net |
5. |
venezuelavirtual.com |
6. |
trompo.com |
7. |
venezuelaonline.com |
8. |
venezuelavirtual.com |
Fuente:
Ing. Roberto Piol: Avalúo de Páginas Web (Website Aprraisal)
La
ingente cantidad de información que anda dispersa por la Red serviría de bien
poco si no fuéramos capaces de localizarla. Desde los albores de Internet los
índices y motores de búsqueda han sido una herramienta imprescindible para
recuperar la información, pero la situación en este sector ha variado mucho en
los últimos tiempos.
Los nuevos motores de
búsqueda son más potentes y albergan muchas más páginas web en sus bases de
datos. La clásica distinción entre buscadores, arañas (robots que rastrean la
Red para indexar páginas) y directorios (clasificaciones confeccionadas por
humanos), se ha disipado. Ahora prácticamente todos añaden al cajetín de
búsqueda un índice de contenidos basado habitualmente en el Open Directory
Project (un proyecto colaborativo para construir un gran listado de enlaces
seleccionados por voluntarios), aunque algunos mantienen directorios
organizados según criterios propios.
En un buscador hay
dos factores importantes a valorar:
Evidentemente, a los
usuarios no les gusta nada descubrir que los resultados de búsqueda están
determinados por el precio pagado. Así lo demuestra un reciente estudio de
Consumer WebWatch, que revela que los internautas no conocen el funcionamiento
de los buscadores y pierden confianza en ellos cuando descubren que incluyen
resultados comprados por los anunciantes:
El panorama de los
buscadores ha cambiado rápidamente en pocos años. Si antes Yahoo! y AltaVista
se disputaban el favor de los usuarios, con una buena cohorte de motores de
búsqueda abriéndose camino, ahora los internautas tienen un claro favorito,
Google, que merece un capítulo a parte. Sin embargo, tras sus recientes
adquisiciones, Yahoo! pretende seguir sus pasos.
Buscadores inteligentes
La empresa Intag (Intelligent Agents Internet Corp.) de Estados
Unidos y la Universidad Caece de Buenos Aires presentaron el primer prototipo
de "Mapa de Conocimiento Humano", que recopila el conocimiento sobre
informática, computación y telecomunicaciones que hay en Internet. Se trata de
un mapa "inteligente" que fue desarrollado utilizando la tecnología
de la empresa denominada FIRST (Full Information Retrieval System Thesaurus),
un sistema que permite buscar, incorporar y desechar contenido de Internet
según los patrones de comportamiento e interés de sus usuarios de forma
autónoma y casi sin intervención humana.
Lo de "inteligente" se debe al hecho de que el sistema
tiene "capacidad auto evolutiva y es capaz de aprender tanto como sea
posible de sus usuarios, detectando y clasificando sus patrones de
conducta", según informan en el sitio. "Así, clones de este prototipo
hospedados en cualquier sitio Web se adaptan en forma continua y automática a
las necesidades de sus usuarios, ya que reconocen sus pautas de conducta",
agregan en la Universidad.
El ingeniero argentino Juan Chamero, define al "mapa"
como un sistema informático "con agentes inteligentes de búsqueda a los
que se les da instrucciones precisas para encontrar datos sobre temas
específicos en la web".
Infografías
1.
Autor: Buscaportal.com
Contenido: Portal que incluye información
relevante sobre las formas de buscar información en Internet, motores de
búsqueda, tipos de motores, resultados de búsquedas, búsqueda avanzada de
datos, entre otros.
URL http://www.buscarportal.com/articulos/buscar.php
2.
Autor: Adrian
Hall/Nº 1 en Buscadores
Contenido: Definición de buscadores,
directorios y portales
URL http://www.1-en-buscadores.com/buscadores.html
3.
Autor/Título: Ing.
Roberto Piol /Avalúo de páginas Web (Website Appraisal)
Contenido: Trabajo en el que presenta un Modelo de Valoración de Páginas Web
(Website Appraisal), analizando desde las características de su Dominio hasta
los costos de Diseño, Alojamiento y Mantenimiento de la misma. De éste se
extrae datos sobre el la lista de los 15 buscadores mas utilizados en el año
2001.
URL: http://www.gestiopolis.com/recursos/documentos/fulldocs/ger/avalpagweb.htm
4. Autor/Título: Héctor Fernández para Wikipedia, La Enciclopedia Libre: Tipos de Motores de
Búsqueda
Contenido: El autor presenta en su escrito los diferentes tipos de buscadores
definiendo sus principales características.
URL: http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsqueda
5. Autor/Título: J.C. Daccach: Álgebra Booleana Básica
Contenido: El autor presenta un conjunto de recomendaciones para optimizar la
búsqueda el Internet a través del uso de operadores booleanos.
URL: http://www.buscarportal.com/articulos/motores_busqueda.php
6.
Autor/Título: Nacho Rojo para Consumer.es/Fundación
Eroski: La Internet Invisible
Contenido: El reportaje refiere la existencia de una gran cantidad de información en
Internet que no esta al alcance de los buscadores, a la cual el autor denomina
“Red Invisible” que se encuentra en bases de datos especializadas.
URL http://www.consumer.es/web/es/tecnologia/internet/2004/11/04/111386.php?print=true
7. Autor/Título:
StudioHz.com/Google y … Los Otros?
Contenido Artículo que muestra las bondades y preferencias de los internautas
en el uso de este potente buscador. Además presenta algunos problemas
derivados de las últimas actualizaciones.
URL: http://www.studiohz.com/articulos_internet.asp?id=31
8.
Autor: ISOBAR-AEGIS
MEDIA
Contenido: Este artículo de ntbuscadores, presenta la importancia
que tiene para su empresa el promocionarse y promocionarse en buscadores de
Internet
URL: http://www.ntbuscadores.com/web-marketing-sem.asp
9.
Autor/Título: Preguntas mas frecuentes sobre
Darwin: Intelligent Website
Contenido: Página donde se presenta información acerca del Prototipo de Mapa de
conocimiento humano desarrollado con tecnologías FIRST, por la empresa Intag (Intelligent Agents Internet Corp.) de Estados Unidos y la
Universidad Caece de Buenos Aires.
URL http://www.intag.org/pages/faq/