| Audiovisual Interactiu |
sessió
8: De la galàxia Gutemberg al planeta Matrix
|
| 0a | 0b | 1 | 2 | 3 | 4 | 5 | 6 | |
![]() |
|
font
imatge: google-watch
|
|
TIPUS
CERCADORS
|
|
| motors de cerca
(search engines) |
basats en informació indexada recollida de forma automatitzada. |
| directoris |
basats en informació ordenada per categories introduïda per humans. |
| híbrids | combinen la intervenció humana amb la recollida automatitzada de dades i la categorització amb sistemes automatitzats de cerca |
| meta-cercadors | fan consultes simultànies a diferents cercadors, millorant la forma de mostrar els resultats i/o destacant els resultats coincidents |
|
PARTS
D'UN MOTOR DE CERCA
|
|
| CRAWLER, spider, webbot, ... | Peça de software que visita una pàgina, la copia, n'identifica els enllaços, els segueix, etc... Amb una periodicitat d'un més o dos torna a visitar la pàgina per si ha desaparegut o ha canviat de continguts o d'enllaços. |
| INDEX,
catàleg, ... |
Base de dades on és emmagatzemada la informació enviada pel Crawler. |
| SEARCH ENGINE SOFTWARE | Part del programa que consulta l'índex en funció d'una petició de cerca i dóna els resultats ordenats segons uns criteris. Per establir aquests criteris s'utilitzen diferents algorismes. |
| font: Danny Sullivan SearchEngineWatch | |
|
CERCADORS
|
||
|
motors
de cerca basats en crawlers
|
||
| Motor de cerca crawler-based; actualment té l'índex més gran; utilitza algorisme propi d'ordenació de resultats. Proveeix a altres cercadors i molts portals i llocs web. | ||
| Alltheweb/FAST | Motor de cerca crawler-based. Segons Sullivan el segon millor | Al © consta Overture S. Inc. Overture ha esta comprat per Yahoo |
| Teoma | Motor de cerca crawler-based. Actualment encara té un índex menor als altres cercadors. | Pertany a Ask Jeeves. |
| Inktomi | Motor de cerca crawler-based. Proveeix a MSN Search entre d'altres. | Propietat de Yahoo. |
|
directoris
basats en editors humans
|
||
| Open Directory Project | Community-based; basat en la feina de milers de voluntaris; és el més complet. Google l'utilitza per al seu Google Directory (que és jerarquitzat per PageRank) | Propietat de Netscape-AOL; pot ser utilitzat per tothom perquè utilitza una llicència oberta. |
| Zeal | Community-based; basat en la feina de voluntaris. | Propietat de LookSmart, li proveeix les ref. no-comercials. |
| Looksmart | Directori compilat per humans. Llistes basades en pagament (com unes pàgines grogues), extreu informació no comercial de Zeal. | |
|
meta-cercadors
|
||
| Yahoo | Inicialment directori editat per humans; des de 2002 passa a utilitzar principalment google com a font d'informació (teòricament creuat amb les seves dades) i segueix mantenint un directori revisat per persones. | |
| Ask Jeeves | Permet preguntes en "llenguatge natural"; utilitza Teoma com a motor de cerca. | |
| MSN Search | Utilitza una barreja de directori d'editors humans (propis i de LookSmart) i de crawler-based (utilitzant Inktomi). | Pertany a Microsoft. |
| AOL search | Utilitza google, només en la seva versió interna (pels clients a qui ofereix connexió a internet) amplia les prestacions | Pertany a AOL/TimeWarner |
| Lycos | Abans un crawler-based amb motor propi; ara basat en Alltheweb | Pertany a Terra-Lycos |
| HotBot | Meta-cercador sobre AllTheWeb.com/FAST, Google, Inktomi i Teoma | Pertany a Terra-Lycos |
|
Nous
projectes
|
||
| The Wondir | Community-based; en fase beta; sistema de preguntes en "llenguatge natural" amb respostes d'altres usuaris. Veure Info. | |
| Nutch | Projecte de fer un motor de cerca open-source equiparable a google | |