Palavras-chave:
Recuperação da informação eletrônica,
Ferramentas de busca, Diretórios de pesquisa, Mecanismos de pesquisa.
Enquanto Garcia, citado por Paldês (1999), considera vantajoso o uso da Internet em relação aos métodos tradicionais como instrumentos de busca de informação científica e para transmissão do conhecimento produzido, discute alguns benefícios gerados pelas atividades empregando o uso da rede:
As tecnologias educacionais favorecem novas formas de acesso à informação, como a navegação hipertextual, busca de informações através de programas de procura, exploração contextual, entre outras.
Um hipertexto é um conjunto de nós ligados por conexões.
Os nós podem ser palavras, imagens, gráficos ou partes de
gráficos, seqüências sonoras, documentos complexos que
podem ser até mesmo os próprios hipertextos (referências
interligando o cruzamento interno das informações no documento).
Os itens de informação não são ligados linearmente,
como em uma corda com nós, mas cada um deles, ou a maioria, estende
suas conexões em uma estrela, de modo reticular. Funcionalmente,
um hipertexto é um tipo de programa para a organização
de conhecimentos ou dados, para a aquisição de informações
e comunicação (Lévy, 1993).
As maiores limitações estão condicionadas em acompanhar os avanços constantes de novos equipamentos (upgrade do hardware) e programas (atualizações dos softwares) disponíveis nos mercados que são inseridos nas unidades de informação sob diferentes condições (estratégicas, administrativas, técnicas e operacionais), e os diferentes tipos de serviços e recursos existentes na Internet para a recuperação da informação.
Outra preocupação a ser considerada refere-se a conexão de acesso nas unidades de informação, uma vez que, geralmente, em cada local foram sendo adquiridos gradativamente equipamentos e programas (muitas vezes otendo-se diferentes versões), e muitas vezes os recursos possuem limitações tais como a falta de memória RAM, espaço no Winchester, recursos multimídia, configurações de vídeo, etc.
O presente foco de análise, são os mecanismos de busca
e diretórios de pesquisa, devido serem recursos essenciais na recuperação
da informação na Web, ou seja, informação textual
e online. Procedeu-se a análise de diferentes sites especializados
sobre mecanismos de busca e diretórios de pesquisa disponíveis
na Web. Sua compilação tem o objetivo de disseminar os recursos
e, cabe salientar também, que não se trata de estudo exaustivo
mas de caráter informativo e instrucional.
Existem servidores WWW dedicados a pesquisa e são consideradas espécies de enciclopédias organizadas por assuntos, que possibilitam consultas por palavras-chave. O interessante é que estes mecanismos não possuem dados sobre os temas listados, apenas apontam para os endereços onde eles se encontram. Estes servidores são banco de dados dinâmicos e abertos, e seus registros são constantemente atualizados, tanto pelo esquema de busca do próprio sistema, quanto pela informação livremente cadastrada por qualquer usuário (Franco, 1997, p. 63).
Conforme publicado pelo Comitê Gestor, a posição do Brasil referente ao número de hosts (servidores), em janeiro de 1999 ocupava o 17° lugar no mundo, com o total de 215.086 hosts. Enquanto nas Américas, encontra-se em 3° lugar (seguindo Estados Unidos com 30.488.565 hosts, e Canadá com 1.119.172 hosts). Isto significa que é necessário saber como localizar a informação nestes hosts. Em termos de Brasil, existe a possibilidade de usar servidores de buscas, tais como o Bookmarks (http://bookmarks.apc.org) que verifica cada servidor com a terminologia .br. Atualmente este mecanismo cadastrou cerca de 830.000 páginas com a terminologia .br.
Para conhecer mais detalhadamente os mecanismos de busca, o jornalista
Sérgio Charlab escreveu a obra Oráculos digitais (http://www.editoras.com/oraculos/),
onde podem ser encontradas as descrições das características
e orientações de como usar alguns dos principais mecanismos
de busca e diretórios de pesquisa na Internet. Com objetivo de apresentar
sucintamente alguns mecanismos de busca e diretórios de pesquisa
existentes no Brasil, foi elaborada a tabela 1 - Diretórios e mecanismos
de busca na WWW brasileira.
|
|
|
Argos | http://www.argos.com.br | Dispõem de mecanismo que vasculha a rede em busca de novas páginas (muito semelhante ao mecanismo BookMarks |
BookMarks Alternex Search | http://bookmarks.apc.org
http://bookmarks.ax.apc.org/ http://bookmarks.ibase.br/ http://bookmarks.ibase.org.br/ http://bookmarks.alternex.com.br |
Apresenta as respostas numa escala e ordenando por relevância. Dispõem de diferentes endereços de acesso. O BookMarks é uma ferramenta do Alternex, primeiro provedor comercial do Brasil. Cadastra páginas .br : atualmente com 830.000 páginas brasileiras indexadas. |
Cadê? | http://www.cade.com.br/
http://www.cade.com.br/intind.htm |
Cadastra páginas enviadas. Índice detalhado dos mecanismos de busca na Internet brasileira: http://www.cade.com.br/intind.htm |
Centro de Informações Internet Brasil | http://www.rnp.br | A Rede Nacional de Pesquisa - RNP, que possui as informações necessárias aos navegantes brasileiros. |
Comitê Gestor Internet Brasil | http://www.cg.org.br/ | O Comitê Gestor da Internet Brasil que tem como principais funções promover o desenvolvimento de serviços Internet no Brasil assim como coletar e organizar informações sobre os serviços Internet. |
Inside Web News | http://news.iis.com.br | Para acessar os newsgroups da Internet com facilidade. O Web News do provedor carioca Inside Information System coloca disponível na WWW os cerca de 18 mil newsgroups que podem ser acessados no Brasil. |
Internet via Embratel | http://www.embratel.net.br | Site da Empresa Brasileira de Telecomunicações – Embratel. A Embratel é o principal backbone da Internet no Brasil. |
Prossiga
- Como achar? |
http://www.prossiga.br/
http://www.prossiga.br/comoachar/index.html |
Arrola informações nas áreas de ciência e tecnologia. Possui links para tutoriais sobre busca na Internet e reúne artigos sobre busca na Internet, além de dicas para quem começa buscas na WWW. |
Radar UOL | http://www.radaruol.com.br | O Radar UOL é uma ferramenta do Universo Online. A grande diferença para as outras ferramentas nacionais são as opções que permitem refinar as pesquisas. |
Surf | http://www.surf.com.br/ | Mecanismo que assumiu as informações cadastradas pelo antigo Yahi ! (versão brasileira do Yahoo!) Apresenta os números de registros, seleciona as páginas por categorias. |
Zeek | http://www.zeek.com.br | Site especializado em educação. Utiliza operadores lógicos na língua portuguesa. |
Cornella (1999) menciona que o campo das ferramentas de busca está em constante evolução, recomendando que para aprender constantemente sobre o tema pode ser localizado no SearchEngineWatch (http://www.searchenginewatch.com).
Uma excelente fonte de referência sobre mecanismos e diretórios de busca elaborada por Carole Leita (1999), compila sites por categorias de temas específicos, apresenta descrição sobre o que se pode encontrar, estando estruturada por:
Os mecanismos de busca, menciona Cohen (1999), são também conhecidos como serviços de busca ou serviços de mecanismos de busca. Isto consiste conforme seus componentes:
Identificação | Endereço na WWW | Características |
AltaVista | http://altavista.com | Indexa mais de 140 Milhões de páginas existentes em 275.600 Servidores, e também 3 Milhões de artigos oriundos de 14.000 Usenet News Groups |
Excite | http://www.excite.com | Indexa 60.000.000 páginas, também pode-se pesquisar 60.000 recensões de Newsgroups |
HotBot | http://www.hotbot.com/ | Este projeto visa indexar todo o conteúdo em texto de 54 milhões de páginas Web, Usenet news e mailing lists. Isto o tornaria o mais potente mecanismo de busca da Internet. O HotBot suporta a lógica AND/OR/NOT e busca por frases. Ele também suporta buscas cronológicas, por domínio e geográficas, assim como buscas por tipo de mídia tais como Java, VRML e Acrobat. O HotBot é um site público em fase beta que encoraja comentários dos visitantes e relatos de "bugs" do serviço. |
Infoseek | http://infoseek.go.com/ | Procura páginas WWW, informações do Usenet, sites populares, indexa cerca de 50 milhões de páginas. |
Northern Light Search | http://www.northernlight.com/ | Indexa e possibilita navegar nas páginas. Arrola mais de 100 milhões de documentos. |
Yahoo! | http://www.yahoo.com/ | Indexa e permite navegar no diretório em suas 1 milhão de páginas cadastradas. |
Ao utilizar diretórios de assuntos, observa-se que existem 2 tipos básicos: acadêmicos e comerciais, onde os interesses podem variar desde o uso intensificado, monitorado, selecionado. Geralmente os diretórios acadêmicos preocupam-se em selecionar links pela qualidade do site.
Portanto, o diretório de assuntos é um serviço
que oferece uma coleção de links dos recursos Internet submetidos
pelo site, criadores ou avaliadores e organizados em categorias de assuntos
(áreas específicas). Os diretórios utilizam critérios
de seleção para os links a serem incluídos. Pode-se
verificar na Tabela 3 alguns dos critérios adotados pelos diretórios
de pesquisa.
|
|
|
Argus Clearinghouse | http://www.clearinghouse.net | Pesquisa orientada (escolar); cobertura muito seletiva devido critérios
específicos; recursos estão em ranking e avaliados; compilado
por bibliotecários que são especialistas em assuntos; relativamente
uma base de dados pequena.
|
Enclyclopedia Britannica's Internet Guide | http://www.eblast.com | Arrola assuntos do interesse geral/tópicos educacionais; seletividade
média alta -- sites são revisados e reordenados no ranking;
compilado pelo pessoal da Encyclopedia Brittanica (especialistas por assuntos);
arrola acima de 125 000 sites.
|
Infomine: Scholarly Internet Resource Collections | http://lib-www.ucr.edu/ | Pesquisa tópicos a nível universitário; alta seletividade;
compilado por bibliotecários; arrola cerca de 14 000 sites
|
Indexar páginas para obter o máximo em acesso; eis o importante
papel do Webmaster - pessoa responsável pelo planejamento, design
e execução das páginas Web. Portanto, necessita-se
conhecer como os mecanismos de busca recuperam a informação,
por exemplo: tamanho, categoria do spider, o suporte das etiquetas Meta,
se reconhece frames, se é compatível com mapas de imagens,
comentários em HTML, pesquisa URL, etc., uma vez que, o conteúdo
da informação recupera-se pelas diferentes compatibilidades
inseridas nos documentos disponibilizados na Web.
|
|
|
All4one | http://all4one.com | Índice de meta-mecanismos de busca, compila mecanismos de busca. |
All-in-One Search Page | http://www.albany.net/allinone/ | Este site reúne inúmeros localizadores de informação da Net. Além disso, permite que sejam realizadas buscas de arquivos usando as ferramentas Archie e Veronica. |
Cyber 411 | http://www.cyber411.com | Busca simultânea em 16 mecanismos de busca. |
The Internet Sleuth | http://www.isleuth.com | Indexa mais de 3.000 bases de dados (muitas destas não são indexadas pelos grandes mecanismos de busca) cobrindo uma variedade imensa de tópicos. |
Mamma | http://www.mamma.com | Utiliza 7 mecanismos de busca. Relaciona cerca de 2200 revistas (por categoria) e 900 jornais (por local). Bastante rápido. |
Northern Light | http://www.northernlight.com | A Northern Light é uma nova forma de organizar o resultado da busca: qualquer procura resulta em duas colunas: "Best Documents" (melhores documentos) do lado direito, e "Custom Search Folders" (Pastas de Procura Refinada) do lado esquerdo. |
MetaCrawler | http://www.metacrawler.com | Em vez de manter uma base de dados própria, ele remete sua pesquisa para outras ferramentas incluindo Lycos, WebCrawlwer, Excite, AltaVista, Yahoo, HotBot e Galaxy. |
Multimeta | http://www.multimeta.com | Procura em 10 mecanismos de busca internacionais. |
1Blink.com - OneBlink.com | http://www.1blink.com | Realiza a busca em: Infoseek, AltaVista, HotBot, Alcanseek, Yahoo!, Northern Light, Excite, Lycos, Thunderstone, EuroSeek e Planet Search. |
Online Language Dictionaries and Translators | http://rivendel.com/~ric/resources/dictionary.html | Oferece links para mais de 80 dicionários para tradução de idiomas. |
ProFusion | http://profusion.ittc.ukans.edu | Busca simultaneamente em 9 mecanismos. Premiado como meta-mecanismo de busca pela revista PC Professionell, n. 12, 1998. |
Search Spaniel | http://www.searchspaniel.com | Realiza busca em 12 mecanismos. |
Em termos de Brasil, até o presente momento, foi possível indentificar dois meta mecanismos de busca: MetaMiner e MetaBusca ZAZ.
MetaMiner (http://miner.uol.com.br), estruturado por diferentes categorias, realiza buscas por palavras-chaves nas principais ferramentas de busca nacionais (Achei, Cadê?, Radar UOL, Surf, Zeek) e internacionais (AltaVista, AOLNetFind, Excite, Hotbot, Infoseek, Lycos, Webcrawler e Yahoo!). Os internautas que consultarem o MetaMiner ainda poderão utilizar os serviços do BookMiner, para pesquisar livros em livrarias nacionais e internacionais; CDMiner, para consultar catálogos de CD's em lojas nacionais e internacionais; NewsMiner, para pesquisar notícias nos principais jornais do Brasil; SoftMiner, para procurar software na Internet e CopaMiner, um banco de dados sobre futebol e notícias relacionadas à Copa do Mundo.
MetaBusca ZAZ (http://metabusca.zaz.com.br/busca/metabusca/home.htm), possibilita procurar informações na Internet, pessoas (utiliza as bases de dados das listas telefônicas brasileiras), games, livros e CDs. Proporciona ao usuário limitar o tempo de espera de resposta (entre 30 a 180 segundos). No caso de realizar a busca, surge um menu pelo qual o usuário decide quais os mecanismos de busca nacionais (Aonde, Bookmarks, Cadê?, GuiaWeb, Radar UOL e Zeek), internacionais (AltaVista, AOLNetFind, Excite, Hotbot, Infoseek, Magellan e Yahoo!). Possibilita escolher os mecanismos de busca por idiomas - espanhol, alemão, frances, italiano. Para localizar pessoas o MetaBusca permite selecionar os internacionais (AltaVista People Search, Bigfoot.com, ICQ, WhoWhere, Yahoo People Search) e nacionais ( CTMR, Telebahia, Telebrasília, Teleceara, Telegoias, Telemig, Telepar, Telerj, Telesc e CRT).
Entre as técnicas de pesquisa, existem poderosas ferramentas além das palavras-chave ou lógica booleana, para pesquisar na Web sobre informação detalhada e especifica referente aos competidores.
Cornella (1999) apresenta uma reflexão sobre o avanço no campo das ferramentas de busca, tais como:
|
|
Pelo campo | Última data modificada, Domínio/Site/URL, Locação Geográfica, Idioma, Imagens, Multimídia & vídeo, Linguagem de Programação, Nomes próprios, Sons, Título |
Pela lógica de busca | Operadores Booleanos, Lógica booleana inteira com o uso dos parenteses, Booleana implícita +/-, Operador Booleano com terminologia padrão, Busca pela proximidade |
Pelas opções de busca | Requisitos estabelecidos pelo usuário, Casos sensíveis, Entruncamento, Entruncamento automático, Busca por conceitos aplicados a sua pesquisa, Sua pesquisa somente em inglês, Tradução de páginas resultantes de busca, ou qualquer texto, para e de idiomas específicos, Frase exata com aspas duplas Maioria das frases com aspas duplas (i.e., frases com stop words tem requirementos especiais), Uma frase exata com formulário padrão de escolha, Maioria de frases com formulário de padrão de escolha(i.e., frases com stop words devem ter outras palavras na frase) |
Por resultados da busca | Resultados agrupados por conceitos e/ou tipo de site
Resultados como série de questões para auxiliar na localização de sites(s) relevantes Resultados com base na popularidade, i.e., selecionados por outros buscadores Resultados com base nos lins, i.e., número de links de páginas com alta percentagem de páginas Web Agrupamento de resultados encontrados numa vez por site com a opção de ver todos Pesquisando com resultados Resultados similares aos documentos no resultado existente Controle sobre fatores no ranking de relevância Termos de busca alternativa Questões armazenadas no site e notificação de novos resultados |
Procurando pela qualidade, tamanho e tipo da Base de dados | Base de dados volumosa, e.g., cerca de 110 millões de arquivos
Mecanismos de busca múltipla simultânea com duplicação dos registros removida Usenet newsgroups Base de dados baseada em tópicos Pequenos mas avaliados - diretórios de assuntos Amplo mas não-avaliado - diretório de assuntos |
A utilização de mecanismos e diretórios de busca permitem que o usuário ao formular sua pesquisa possa recuperar diferentes tipos de informação. Cabe lembrar que cada recurso possui limitações, vantagens e desvantagens.
Este artigo apresentou apenas uma faceta de recursos que estão sendo desenvolvidos e utilizados na busca de informação eletrônica existente na Internet. Recomenda-se que sejam efetuados mais investigações sobre os mecanismos e diretórios de busca, principalmente os existentes no Brasil, para facilitar a disseminação e recuperação da informação eletrônica na Web.
COHEN, Laura, JACOBSON, Trudi. Evaluating Internet Resources. 1996. URL http://www.albany.edu/library/internet/evaluate.html (Obtido em 25/05/1999)
COHEN, Laura. Boolean Searching on the Internet. 1999. URL: http://www.albany.edu/library/internet/boolean.html (Obtido em 25/05/1999)
COHEN, Laura. Checklist of Internet Research Tips. Atualizada em abril de 1999. URL: http://www.albany.edu/library/internet/cheklist.html
COHEN, Laura. Conducting Research on the Internet. 1999. URL: http://www.albany.edu/library/internet/research.html (Obtido em 25/05/1999)
COHEN, Laura. How to Choose a Search Engine or Research Database. 1999. URL: http://www.albany.edu/library/internet/choose.html (Obtido em 23/03/1999)
COHEN, Laura. Searching the Internet: Recommended Sites and Search Techniques. 1999. URL: http://www.albany.edu/library/internet/search.html (Obtido em 25/05/1999)
COMITE GESTOR. Links de Interesse. URL: http://www.cg.org.br/links.html (Obtido em 08/06/1999)
COMITE GESTOR. Posição do Brasil no Mundo. Última modificação 28 de Maio de 1999. URL: http://www.cg.org.br/PosicBRMundo.htm#Posição (Obtido em 09/06/1999)
CORNELLA, Alfons. O avanço das ferramentas de busca. 03/06/1999. INFONOMIA: A informação nas organizações, jun. 1999. (Obtido em 08/06/1999. Originais em espanhol na URL: http://www.extra-net.net)
ELKORDY, Angela. Web Searching, Sleuthing and Sifting: Lesson 2: Web Directories. Copyright © 1998-99. URL: http://www.angelfire.com/in/virtuallibrarian/syllabus.html (última atualização 24/02/1999, obtido em 23/03/1999)
FRANCO, Marcelo Araújo. Ensaio sobre as tecnologias digitais da inteligência. Campinas : Papirus, 1997. 111 p.
HARTGES, Hans-Dieter. Bibliographischer Werkzeugkasten: SuchMaschinen. URL: http://www.hbz-nrw.de/hbz/toolbox/suchen.htm (última atualização 07.05.1999, obtido em 08/06/1999)
LEITA, Carole. Librarian's Index to Internet. URL: http://sunsite.berkeley.edu/InternetIndex/ (Última atualização realizada em 03/05/1999. Obtido em 08/06/1999)
LÉVY, Pierre. As tecnologias da inteligência: o futuro do pensamento na era da informática. Rio de Janeiro: Editora 34,1993 (Coleção TRANS)
PALDES, Roberto Ávila. O uso da Internet na educação superior de graduação: estudo de caso de uma universidade publica brasileira. Brasília, 1999. Dissertação (Mestrado em Educação) - Universidade Católica de Brasília- (UCB), abr, 1999. Disponível em: http://www.oocities.org/CapeCanaveral/Launchpad/5606/portugues/paginic.html
UNIVERSITY OF CALIFORNIA. Searching the World Wide Web: strategies, analyzing your topic, choosing search tools. Berkeley, ©1996-1999. URL: http://www.lib.brekeley.edu/TeachingLib/Guides/Internet/Strategies.html (última atualização 2/1/1999, obtido em 24/03/1999)
VON KEITZ, Wolfgang. Such- und Findmaschinen im Internet. 25/11/1997. (Palestra na área de Media-Talk) URL: http://machno.hbi-stuttgart.de/~keitz/Findmaschinen.html (Obtido em 03/04/1999)
|
|