quarta-feira, 8 de agosto de 2007

Roteiro Aula Buscas na Web


1) Importância das buscas

a) Avalancha informativa - Cinco exabytes de informação por ano = Cinco trilhões de megabytes
50 mil vezes todo o conteúdo em livros e documentos guardados na biblioteca do Congresso norte-americano, a maior do mundo (30 milhões de livros). É mais do que todas as palavras pronunciadas por todos os seres humanos desde o início da humanidade.

b) 97 milhões de páginas ativas (08/08/07)- 340 mil novas páginas por dia. (280 mil ponto com – comerciais)
c) 100 bilhões de páginas na web profunda
d) Brasil: 39 milhões e 140 mil usuários / 21% da população / crescimento de 680% desde 2000).
e) Busca é o setor que mais cresce na web
f) Empresas mais valorizadas

2) Privacidade

a) Tudo o que é publicado fica na rede
b) Documentos antigos podem ser recuperados
c) Homônimos aparecem com ficha criminal
d) Mecanismos sabem o que você está buscando

3) Ferramenta de trabalho

a) Essencial para jornalistas, empresários, pesquisadores e marqueteiros.
b) Jornalismo assistido por computador é sinônimo de buscas;
c) A web não seria possível sem as buscas porque a quantidade de informações se tornaria inútil na ausência de ferramentas para encontra-las.
d) Profissionais de buscas – information brokers
e) Profissões baseadas em buscas.

4) Sistemas de buscas

a) Motores de buscas – bots indexação automática
b) Diretórios – indexação humana
c) Sistemas mistos – motores e diretórios
d) Metabuscas – buscas em buscas http://www.metacrawler.com/
http://www.dogpile.com/
e) Mecanismos especializados
Local - http://local.com/
Ônibus Táxi http://labs.google.com/ridefinder
http://www.nextbus.com/predictor/newUserWelcome.shtml
Dicionários - Answers
Pessoas amigos grupos - http://www.meetro.com/
Individuais http://zabasearch.com/
Clusters - http://www.dumbfind.com/ http://clusty.com/
Tendências, favoritos http://www.google.com/press/zeitgeist.html
Mapas - Google Maps , http://virtualearth.msn.com/
Wiki - http://www.placeopedia.com/
Blogs - http://www.blogdigger.com/
http://google.com/blogsearch
http://battellemedia.com/
http://blogdex.net/
Papers acadêmicos http://scholar.google.com/
Audio http://audio.search.yahoo.com/
Vídeo http://www.blinkx.tv/
Por perguntas http://www.ask.com/ -
Texto http://library.albany.edu/internet/deepweb.html
Negócios – Kompass http://www.kompass.com/kinl/en/
Hoover’s http://www.hoovers.com/free/
Nexis Plexis empresas http://www.lexisnexis.com/
Artigos de revistas http://www.findarticles.com/
Siglas http://www.acronymfinder.com/
Buscas no mundo http://www.depotz.net/bluebook/index.html
Brasileiros – Radar http://radaruol.uol.com.br/
Brbuscas http://www.brbusca.com/index.html
Busca Aki http://www.buscaki.com.br/
Cadê - http://br.cade.yahoo.com/

5) Fenômeno Google

a) História
b) Crescimento e expansionismo
c) Dominação da web Epic 2014 http://mccd.udc.es/orihuela/epic/
http://www.youtube.com/watch?v=U2LcBmoE6Ws em português (som ruim)
http://www.youtube.com/watch?v=HPwvGpBw5Gw (em português som melhor)
verbete wikipedia (em inglês) http://en.wikipedia.org/wiki/EPIC_2014


6) Tutorial

a) Ver post abaixo


7) Jogo

a) Teste de conhecimentos sobre buscas http://websearch.about.com/library/quizzes/websearch_quiz/blwebsearchquiz.htm
b) Busca por nome de cada aluno
c) Ver quem consegue o resultado de uma busca a partir de no mínimo duas palavras e com mais de um resultado (zero resultados não vale).
8) Textos de apoio
Sistemas de busca da web: diretórios e mecanismos de busca (2001)
http://www.quatrocantos.com/TEC_WEB/sist_busca/SB_SUM.HTM


Tutorial Básico de Buscas

- O garimpo de informações é a segunda principal atividade dos navegadores da Web, depois do uso do correio eletrônico.
- Mas 20% a 30% das pessoas que buscam algo na WEB queixam-se de que não conseguem achar rapidamente o que procuram.
- Se você é um deles, aqui está um tutorial simples para ajudá-lo a encontrar o que deseja rapidamente.

- Escolha a opção que mais se adaptar ao seu caso e procure a resposta no número correspondente:

1) Você não tem certeza do que deseja e tem pouca experiência em buscas na WEB;
2) Você sabe o quer, mas está em dúvida sobre que mecanismo deve usar;
3) Saiba como usar os "símbolos booleanos".
4) Você precisa de resultados rápidos.
5) Como fazer buscas especializadas, imagens por exemplo.
6) Garimpando na WEB Invisível.

1)Você não tem certeza do que deseja e tem pouca experiência em buscas na WEB:

Prefira sites com motores de busca (search engines). Num motor de buscas, basta você colocar uma palavra chave no espaço destinado à consulta e acionar o botão procura ou busca. Dica: para obter resultados mais precisos use no mínimo três palavras chaves começando por aquela que melhor define a busca. Se os resultados não agradarem, mude a ordem das palavras chaves. Sempre que possível faça a mesma busca em mais de um motor de buscas.

No caso de busca de uma expressão específica ou nome de pessoa coloque a expressão ou nome entre aspas no espaço reservado à palavra chave (isto trará só os resultados contendo a expressão ou nome exatos).

Vantagens
A) O sistema de motor de buscas é o que faz a pesquisa mais ampla e detalhada na WEB.
B) O motor de buscas leva você para dentro de um documento.

Desvantagens
A) Muito provavelmente você receberá uma avalancha de resultados, caso a palavra chave seja muito comum.
B) É grande o risco de encontrar resultados repetidos ou dados desatualizados.
O Google (
www.google.com.br) é o mais famoso e mais usado sites baseado em motores de busca.

2) Você sabe o quer, mas está em dúvida sobre que mecanismo deve usar:

Os buscadores mais experientes preferem os diretórios - Se você quer fazer uma pesquisa sobre história da arte, por exemplo, a melhor opção é procurar um site de buscas que use o método de diretório (directory). No sistema de diretórios, você escolhe uma categoria (no caso arte) e depois vai fazendo o mesmo nas subcategorias (por exemplo, história) até chegar a uma lista de documentos relacionados com os temas que você procura. O sistema de diretório é quase igual ao sistema de classificação de livros numa grande biblioteca. Os diretórios levam você para um endereço na Web, ao contrário dos motores que o conduzem direto a um documento.

Vantagens:
A) A pesquisa dos resultados é mais fácil porque o número de documentos que você encontrou após percorrer as várias subcategorias é bem menor que os recebidos num motor de buscas usando as mesmas palavras chaves (história da arte).

B) A atualização é maior e a repetição de resultados também é muito menor. A atualização é maior porque os diretórios de buscas o levam sempre para a ultima versão da página procurada, enquanto os motores de buscas podem exibir cópias antigas. Para fazer buscas em jornais, revistas ou sites de atualização muito freqüente prefira sempre os diretórios.

Desvantagens:
A) O universo de documentos é bem menor do que o de um motor de buscas. Muita informação boa e importante pode ficar de fora. B) Existe a possibilidade de erro humano na classificação por categorias. C) A informação sobre os documentos é menor do que no motor de buscas, porque o índice está apoiado em fichas e não sobre o original. D) A busca através de um diretório leva você até a página onde está localizado o documento. Você deve fazer a busca dentro da página.
O mais popular diretório de buscas é o Yahoo (
http://br.yahoo.com/) . Em português temos o Cadê (http://br.cade.yahoo.com )

3) Saiba como usar os símbolos booleanos
Para quem não é um principiante em buscas na WEB, o ideal é combinar o seu motor de buscas preferido com o uso dos símbolos booleanos. Os símbolos booelanos são as palavras and e or , ou + e - .

Quando se usa and significa que a busca trará resultados com as duas palavras juntas (ponta and grossa, por exemplo para obeter resultados sobre ponta grosso) A expressão or é usada quando se quer reforçar a procura tanto por uma como outra, mas não necessariamente juntas.
O símbolo + tem o mesmo uso que and. O símbolo – exclui a palavra que o segue (ponta-grossa, só virão resultados com a palavra ponta)

Vantagens
A) É possível encontrar nomes de pessoas e seus respectivos endereços eletrônicos dentro de um documento. Você pode localizar uma receita específica de um prato, enquanto o diretório o levará para uma categoria, tipo comida brasileira.
B) Você pode localizar informações específicas sobre um destino turístico ou modelo de carro enquanto o diretório lhe dará uma lista de guias de viagem ou de revendedoras.

Desvantagens
Exige conhecimentos básicos da linguagem booleana de buscas.


4) Você precisa de resultados rápidos:
Quem tem muita pressa deve escolher algum mecanismo que use as chamadas metabuscas. Este sistema procura a/s palavra/s chave/s em outros programas de buscas em vez de vasculhar a WEB inteira.

Os resultados aparecem numa lista única (caso mais comum), onde os endereços repetidos são eliminados, ou uma lista múltipla, onde são mostrados os resultados obtidos em cada programa pesquisado.

Vantagens
Os programas de meta buscas normalmente fornecem os endereços mais procurados nos programas pesquisados. A premissa é a de que os endereços mais populares são também os melhores.

Desvantagens
A) Você não tem o controle da pesquisa porque os resultados dependem da forma como eles são selecionados e classificados pelo programa escolhido.
B) Os resultados são pouco precisos porque a área pesquisada na WEB é menor.Os mais conhecidos mecanismos de metabuscas são o: DogPile (http://www.dogpile.com/ ), Metacrawler (http://www.metacrawler.com/ ) e BlowSearch (http://www.blowsearch.com/ )

5) Como procurar imagens e itens especializados:

Os principais sites de buscas acabaram incorporando tanto o sistema de motores de buscas como o de diretórios. Na verdade sites como o Google, Yahoo e All The Web (http://www.alltheweb.com/ ) são considerados sistemas mistos, onde as buscas incluem também itens especializados como imagens, áudio, grupos de discussão, notícias, comércio eletrônico e mais recentemente até blogs.

Dica – Se você está procurando weblogs , procure o SearchBlog (http://battellemedia.com/ ), o BlogSearch (http://search.blogger.com/ ) ou o Google Blog Search (http://google.com/blogsearch ) . Para quem deseja descobrir sites que usam o sistema RSS (aviso automático de atualização de páginas) pode procurar no BlogDigger (http://www.blogdigger.com/ ) .

6) Garimpando na Web Invisível
Caso você tenha que fazer uma busca especializada em bancos de dados de universidades, empresas, governos ou de entidades de pesquisas, a saída é entrar na WEB invisível. São sites protegidos por senhas ou mecanismos que impedem a ação dos motores de buscas.
Alguns pesquisadores norte-americanos afirmam que a Web invisível pode ser até 400 vezes maior que a visível, que reúne aproximadamente 2,1 bilhões de páginas.

Para entrar no lado oculto da Web você precisa obter autorização ou chegar até o local onde se encontra o documento procurado, através de endereços de acesso, onde o interessado deve cadastrar-se.
Existem mecanismos de buscas especializados procurar informações na web invisível, também chamada de web profunda. Um deles é o Complete Planet (em inglês)

Nenhum comentário: