Audiovisual Interactiu
 sessió 8: De la galàxia Gutemberg al planeta Matrix
0a | 0b | 1 | 2 | 3 | 4 | 5 | 6

 

font imatge: google-watch

 

TIPUS CERCADORS
motors de cerca
(search engines)
basats en informació indexada recollida de forma automatitzada.
directoris
basats en informació ordenada per categories introduïda per humans.
híbrids combinen la intervenció humana amb la recollida automatitzada de dades i la categorització amb sistemes automatitzats de cerca
meta-cercadors fan consultes simultànies a diferents cercadors, millorant la forma de mostrar els resultats i/o destacant els resultats coincidents

 

PARTS D'UN MOTOR DE CERCA
CRAWLER, spider, webbot, ... Peça de software que visita una pàgina, la copia, n'identifica els enllaços, els segueix, etc... Amb una periodicitat d'un més o dos torna a visitar la pàgina per si ha desaparegut o ha canviat de continguts o d'enllaços.
INDEX, catàleg, ...
Base de dades on és emmagatzemada la informació enviada pel Crawler.
SEARCH ENGINE SOFTWARE Part del programa que consulta l'índex en funció d'una petició de cerca i dóna els resultats ordenats segons uns criteris. Per establir aquests criteris s'utilitzen diferents algorismes.
font: Danny Sullivan SearchEngineWatch

 

CERCADORS
motors de cerca basats en crawlers
Google Motor de cerca crawler-based; actualment té l'índex més gran; utilitza algorisme propi d'ordenació de resultats. Proveeix a altres cercadors i molts portals i llocs web.  
Alltheweb/FAST Motor de cerca crawler-based. Segons Sullivan el segon millor Al © consta Overture S. Inc. Overture ha esta comprat per Yahoo
Teoma Motor de cerca crawler-based. Actualment encara té un índex menor als altres cercadors. Pertany a Ask Jeeves.
Inktomi Motor de cerca crawler-based. Proveeix a MSN Search entre d'altres. Propietat de Yahoo.
directoris basats en editors humans
Open Directory Project Community-based; basat en la feina de milers de voluntaris; és el més complet. Google l'utilitza per al seu Google Directory (que és jerarquitzat per PageRank) Propietat de Netscape-AOL; pot ser utilitzat per tothom perquè utilitza una llicència oberta.
Zeal Community-based; basat en la feina de voluntaris. Propietat de LookSmart, li proveeix les ref. no-comercials.
Looksmart Directori compilat per humans. Llistes basades en pagament (com unes pàgines grogues), extreu informació no comercial de Zeal.
meta-cercadors
Yahoo Inicialment directori editat per humans; des de 2002 passa a utilitzar principalment google com a font d'informació (teòricament creuat amb les seves dades) i segueix mantenint un directori revisat per persones.
Ask Jeeves Permet preguntes en "llenguatge natural"; utilitza Teoma com a motor de cerca.
MSN Search Utilitza una barreja de directori d'editors humans (propis i de LookSmart) i de crawler-based (utilitzant Inktomi). Pertany a Microsoft.
AOL search Utilitza google, només en la seva versió interna (pels clients a qui ofereix connexió a internet) amplia les prestacions Pertany a AOL/TimeWarner
Lycos Abans un crawler-based amb motor propi; ara basat en Alltheweb Pertany a Terra-Lycos
HotBot Meta-cercador sobre AllTheWeb.com/FAST, Google, Inktomi i Teoma Pertany a Terra-Lycos
Nous projectes
The Wondir Community-based; en fase beta; sistema de preguntes en "llenguatge natural" amb respostes d'altres usuaris. Veure Info.
Nutch Projecte de fer un motor de cerca open-source equiparable a google