Procurando Informações na Internet
Hilton Andrade de Mello
http://www.oocities.org/hamellobr>
hamello@unisys.com.br
1. Introdução
É fato conhecido que praticamente todas as informações de que precisamos podem ser obtidas na Internet. Em princípio isto é verdade, mas o problema é que precisamos descobrir onde estão essas informações, pois elas podem estar armazenadas em computadores fisicamente espalhados pelo mundo.  É como procurar a proverbial agulha no palheiro!
Dado o gigantesco acervo da Internet, faz-se necessário algum mecanismo que guie o interessado nesse complexo universo, sugerindo sites e mesmo pages, onde as informações de interesse possam ser encontradas.
A idéia, que revolucionou a Internet nasceu na Universidade de Stanford (na qual tenho a honra de ter feito a minha pós-graduação em Engenharia Elétrica!) em 1994, quando os então candidatos ao doutoramento, David Filo e Jerry Yang, iniciaram um guia para uso próprio, contendo links de interesse pessoal.
Em breve, esse guia, chamado inicialmente de "Jerry's Guide to the Word Wide Web", estava sendo usado por milhares de pessoas e recebeu, dos seus autores, o nome de Yahoo!. Em 1995 foi efetivamente criada uma companhia, a Yahoo! Inc., hoje espalhada pelo mundo e com um papel de destaque na Internet.
Seguindo o extraordinário sucesso do Yahoo!, vários outros sistemas foram criados, como o Altavista, Lychos, Google, Cadê (no Brasil) e muitos outros.
Neste trabalho, vamos mostrar como obter informações, utilizando três desses poderosos auxiliares.
2. Diferença entre Directory (Diretório) e Search Engine (Dispositivo de Busca)
Há dois modos básicos de organizar as informações na Internet: o primeiro usa uma estrutura de diretórios, similar à do Windows, e o segundo utiliza o chamado search engine (dispositivo de busca).
Vamos analisar os dois métodos.
2.1. Directory (Diretório)
A primeira idéia que surge para organizar as informações, de modo que as mesmas possam ser resgatadas facilmente, é adotar uma organização similar aos diretórios usados pelo Windows para classificar as informações, partindo de um tema mais geral para um tema mais particular. Por exemplo, o Yahoo! usa 14 categorias principais, que são:
Arts & Humanities
Business & Economy
Computers & Internet
Education
Entertainment
Government
Health
News & Media
Recreation & Sports
Reference
Regional
Science
Social Science
Society & Culture
Dentro de cada grupo principal são criados sub-grupos, exatamente como se faz no Windows. Uma vez organizada a árvore de diretórios, um grupo de editores (pessoas físicas) classifica cada site visitado, dentro do diretório adequado.
Por exemplo se quisermos encontrar sites que tratem do Serviço de Inteligência dos Estados Unidos, basta seguir a seguinte seqüência na árvore de diretórios:
Government/U_S_Government/Intelligence/
Ou, se quisermos informações sobre o pássaro conhecido como woodpecker (pica-pau), basta seguir a seguinte seqüência:
Science/Biology/Zoology/Animals_Insects_and_Pets/Birds/Species/Woodpeckers/
Em resumo, a estrutura em diretórios, apresenta o site ou home page que contém a informação desejada, mas não indica as páginas individuais do site. O interessado navega nas diversas páginas e analisa o conteúdo do site.
2.2. Search Engine (Dispositivo de Busca)
O search engine difere da estrutura em diretórios, pois visita cada página de um site, colhe palavras-chave e organiza um banco de dados com as palavras-chave e as páginas da Internet onde essas palavras foram localizadas.
De imediato, percebemos que se trata de um trabalho gigantesco, que somente pode ser executado por meio de computadores e não por pessoas físicas, como é feito no caso dos diretórios. Na realidade, os search engines ficam automaticamente e constantemente vasculhando as páginas da Internet, escolhendo palavras-chave e acrescentando essas informações ao seu banco de dados.
Quando queremos descobrir um determinado tema, escolhemos palavras-chave que julgamos adequadas e consultamos o banco de dados, que nos fornece então as páginas que contêm a informação desejada. O problema que há nesse tipo de busca é que os search engines utilizam critérios específicos para selecionar as páginas e é necessário saber como eles procedem, para fazermos uma busca efetiva. Este assunto será abordado quando estudarmos cada search engine.
Em resumo, para usar um search engine, escolhemos palavras-chave e consultamos o seu banco de dados, que então fornece as páginas que contêm essas palavras.
3. Estudo dos Principais Sistemas Existentes
3.1. Altavista
O Altavista é um poderoso search engine que tem indexadas mais de 250 milhões de páginas da Web. Para entrar no Altavista usamos o seguinte endereço, no browser (programa navegador):
É aconselhável incluir esse endereço nos "favoritos" ou bookmarks do navegador, para que não tenhamos que digitá-lo sempre que quisermos entrar no Altavista.
Quando entramos no Altavista encontramos, na região superior da página, as seguintes informações:
|
|
Advanced | |
Para utilizar os diretórios clicamos na lingüeta Directory e para utilizar o search engine clicamos na lingüeta Web.
Normalmente, quando entramos no Altavista, o sistema automaticamente ilumina a lingueta Web, indicando que o sistema está pronto para usar o search engine. Em linguagem técnica dizemos que o default (escolha padrão) do Altavista é o search engine.
3.1.1. Uso do Search Engine do Altavista
Basicamente, o que se tem que fazer é colocar a palavra-chave no retângulo em branco e clicar no botão Search.
Acontece que o search engine é extremamente poderoso e permite um grande número de possibilidades. De imediato, vemos que podemos selecionar a língua desejada. Na extrema direita vemos a palavra Advanced significando que uma busca especial (avançada) pode ser feita utilizando critérios especiais.
Nessa introdução vamos ilustrar apenas a pesquisa básica, deixando o advanced search para o leitor mais especializado, que queira dedicar mais tempo ao assunto. Esse leitor pode clicar diretamente em Advanced e seguir as instruções que serão apresentadas.
Digamos que queremos procurar páginas da Internet que tratem do tema Art Noveau. Escrevemos art noveau (exatamente deste modo) no retângulo em branco e clicamos em Search.
art noveau |
search |
Como o Altavista procede?
Sugerimos que o leitor execute essa ação e acompanhe a nossa explicação, estando ciente que os números apresentados por nós serão diferentes dos que ele terá na sua tela, pois o search engine está continuamente checando as páginas e, de um dia para o outro, páginas podem ter entrado ou saído do banco de dados.
No nosso caso o Altavista indicou que encontrou 713 resultados. Usando a barra lateral de rolamento e indo até o fim da página, encontramos os seguintes dados:
The number of words that match your
search terms: art 4120182 • noveau 8932
Result Pages: 1 2 3 4 5 6 7 8 9 10 [Next >>]
Back to
top
Observamos que o Altavista listou na tela 10 páginas da Internet e se posicionou na primeira delas. Para ver as demais basta clicar em Next>>, ou então no número 2 (próximas 10 páginas) e, assim, sucessivamente.
Para voltar ao início da página, basta clicar em back to top.
Analisemos agora esses resultados. O Altavista indicou que foram achadas 4120182 páginas com a palavra art e 8932 com a palavra noveau. É claro que, em algumas páginas, as duas palavras poderão estar presentes.
Como o Altavista então procede?
Simplesmente, ele lista primeiro as páginas em que as duas palavras aparecem (mesmo que apareçam isoladas uma da outra) e depois as páginas onde apenas uma das palavras aparece. Ou seja o search engine indica primeiro as páginas mais relevantes, isto é, as páginas em que as duas palavras aparecem, deixando para o fim da lista as páginas de menor relevância.
Será que não há um modo de proceder para que a expressão "art noveau" seja considerada como uma frase?  De fato há. O Altavista procurará a frase inteira se a mesma for colocada entre aspas (quotation marks).
"art noveau" |
search |
Fazendo isso e clicando em search, o Altavista informa que encontrou 2668 resultados, isto é, que em 2668 páginas da Web (das que estão no banco de dados do Altavista!!!), a expressão art noveau foi encontrada.
Na parte inferior da página, surgirá o seguinte resultado:
The number of words that match your
search terms: art noveau 3462
Result Pages: 1 2 3 4 5 6 7 8 9 10 [Next >>]
Isto significa que, nas 2668 páginas encontradas, a frase art noveau foi encontrada 3462 vezes. Basta agora analisarmos as páginas e colhermos a informação de que necessitamos.
Somente com este exemplo o leitor já pode verificar o tremendo auxílio que o search engine pode fornecer, se usado corretamente.
Voltando novamente ao início da página do Altavista, vemos que além de Web e Directory, existem outras lingüetas, a saber: Image, Audio, Video, News. São possibilidades que dirigem mais a nossa pesquisa, pois se quisermos, por exemplo, pesquisar apenas imagens, podemos clicar diretamente nessa lingüeta e dirigir a nossa pesquisa. O mesmo acontece com as demais lingüetas .
Como mencionamos, no menu Advanced há inúmeras outras opções que podem ser incorporadas à pesquisa. Um resumo das mais importantes é apresentado a seguir, complementando a pesquisa sobre art noveau.
"art noveau" +abc... | força que a palavra abc...esteja na página |
"art noveau" -abc... | força que a palavra abc...não esteja na página |
art AND noveau | somente as páginas que contém as duas palavras |
art OR noveau | somente as páginas que contém art ou noveau |
O leitor que tenha um interesse maior no assunto pode entrar na página da Altavista e clicar em Advanced para fazer uma busca mais sofisticada. Mas julgamos que as informações aqui apresentadas satisfarão a maioria dos leitores.
3.1.2. Uso do Diretório do Altavista
Entrando no Altavista e clicando em Directory aparecerão as principais categorias utilizadas pelo Altavista, que podem ser comparadas com as do Yahoo!.
Para chegar a uma informação basta ir navegando nessa estrutura, como exemplificamos para o Yahoo!.
Estudamos com detalhes o Altavista, porque o uso dos demais search engines é bastante similar, embora haja pequenas diferenças entre eles.
3.2. Google
O Google é considerado atualmente o mais poderoso search engine disponível na Internet, com mais de um bilhão de páginas indexadas.
O endereço do Google é http://www.google.com/.
Entrando na página do Google vemos novamente as linguetas Web e Directory. A lingueta Directory permite usar o diretório do mesmo modo que o Altavista. A lingüeta Web permite utilizar o search engine.
Quando clicamos em Directory, vemos na tela a estrutura geral de armazenamento:
Arts Movies, Music, Television,... Business Computers Games Health
|
Home Consumers, Homeowners, Family,... Kids and
Teens News Recreation Reference
|
Regional Asia, Europe, North America,... Science Shopping |
Como no Altavista, basta ir entrando em cada diretório até chegar à informação desejada. Normalmente, quando entramos na página do Google, a lingüeta Web está "acesa", indicando que o sistema está pronto para fazer uma busca utilizando o search engine.
De imediato precisa ser dito que o default do Google é a operação AND. Assim, quando consultamos por exemplo art noveau (desse jeito), o Google nos indicará somente páginas que contêm as duas palavras.
Para a procura de uma frase, basta colocá-la entre aspas, como no Altavista, por exemplo "art noveau".
Além disso, da mesma forma que o Altavista, o Google possui um advanced search que permite formas mais sofisticadas de busca, que poderão ser utilizadas pelos leitores mais experientes.
3.3. Yahoo!
Quando entramos na página do Yahoo!, http://www.yahoo.com, vemos que, na região inferior, aparecem os 14 diretórios básicos já apresentados. Na parte superior, aparece o espaço para colocarmos as nossas palavras-chave e a palavra Search para ser clicada, desse modo utilizando o seu search engine.
Do mesmo modo que no Google, o Yahoo! tem como default a operação AND, ou seja, serão apresentadas as páginas que contêm todas as palavras.
Quando queremos uma determinada frase, basta colocá-la entre aspas, conforme já explicado.
Finalmente, ao lado da palavra Search aparece a opção Advanced Search, para buscas mais sofisticadas.
4. Como Exercitar a Busca de Informações
Apresentamos apenas as noções básicas. Contudo, um uso eficiente dos search engines requer uma certa habilidade, que somente o treinamento contínuo desenvolverá.
As palavras-chave escolhidas, como o nome indica, serão decisivas para que encontremos as informações desejadas. Sugerimos que o leitor escolha um determinado assunto e faça uma serie de consultas utilizando os diversos dispositivos de busca aqui apresentados, usando diversas palavras-chave e até mesmo frases. Depois compare os resultados obtidos.