Metazoekmachines
Ik had u een betere ordening van de "blogroll" beloofd, plus, als het lukt, een zoekmachine speciaal voor de blogs etc. die daaronder zitten, maar dat kost nu meer tijd dan ik heb. Volgende week dus, met het goede voornemen om -- op verzoek van de redactie -- de "posts" wat korter te maken. Nu leef ik me nog één keer uit.
Een paar jaar geleden maakte ik nog wel eens gebruik van een metazoekmachine. Aanvankelijk was dat Ixquick, later Vivísimo. Tegenwoordig doe ik dat bijna nooit meer. Waarom niet?
Laat ik eerst een paar redenen opnoemen waarom je een metazoekmachine zou kunnen gebruiken. Metazoekmachines:
- laten je een zoekactie bij meer zoekmachines tegelijk uitvoeren zonder dat je de vraag steeds opnieuw hoeft te kopiëren of opnieuw in te typen.
- passen op het gecombineerde zoekresultaat van de gebruikte zoekmachines een eigen ranking toe die de "intelligentie" van diverse rankingmechanismen combineert.
- ontdubbelen de zoekresultaten die ze van de diverse zoekmachines krijgen.
- verhogen de kans die ene treffer bij een vraag te vinden die maar door één zoekmachine gevonden wordt.
- bieden vaak extra's zoals categorisatie van het zoekresultaat.
- De mogelijkheid dezelfde vraag door meer zoekmachines te laten uitvoeren, wordt ook geboden door springplankzoekmachines. Een voorbeeld is Turboscout, dat 21 webzoekmachines aan het werk kan zetten, naast speciale zoekmachines voor Images, Reference, News, Products, Blogs en Audio/Video. (Er zijn overigens ook veel metazoekers met zulke speciale diensten.) Twee van de voordelen die springplankzoekmachines boven metazoekers hebben, is dat de vraag per zoekmachine kan worden aangepast en dat alle mogelijkheden van iedere zoekmachine apart kunnen worden gebruikt. Bij metazoekers is ofwel het repertoire beperkt (met als gevolg een nulresultaat als je je buiten dat repertoire waagt), ofwel prefixen (zoals filetype:. inurl: etc.) worden niet als zodanig herkend.
- De meest gebruikte, en ook voor de hand liggende eigen rankingmethode van metazoekers is tweeledig: a. hoe meer zoekmachines een treffer (bij de eerste 10, 20 of 30 van hun resultaten) vinden, des te hoger komt hij in de ranking van de metazoeker b. bij een gelijk aantal zoekmachines telt de geaggregeerde ranking van de betreffende zoekmachines zelf. Een voorbeeld biedt KillerInfo, dat netjes meldt bij welke zoekmachines het zijn treffers heeft gevonden, en op welke plaats ze daar stonden.
Voor zover ik kan zien is er echter geen enkele reden om aan te nemen dat een treffer die (bijvoorbeeld) door drie van vier zoekmachines wordt gevonden en op de eerste plaats is gezet, relevanter zou zijn dan een treffer die door alle vier is gevonden en op de plaatsen 2, 2, 5 en 7 is geplaatst. En er is ook geen reden om te denken dat treffer 1 van MSN Search beter is dan treffer 6 van Google (in het algemeen of voor een bepaalde vraag). Zeker, treffer 1 van MSN Search zal waarschijnlijk bij veel vragen relevanter zijn dan treffer 276 van Google, maar metazoekers beperken zich meestal tot de eerste 10 à 30 treffers van elke zoekmachine. - Het is waar dat metazoekmachines resultaten van diverse zoekmachines ontdubbelen, maar profijt heb je daar natuurlijk alleen van bij die vragen die inderdaad het gebruik van meer zoekmachines wenselijk of noodzakelijk maken.
- Het feit dat zoekmachines unieke treffers kunnen hebben kan inderdaad een reden zijn om een metazoeker te gebruiken. Geen enkele zoekmachine heeft alle URLs op het Web in zijn database, en sommige zoekmachines (Yahoo!, MSN Search) indexeren meer van een document dan andere (Google, Ask Jeeves/Teoma). Dit voordeel van metazoekers wordt echter in veel gevallen sterk gerelativeerd doordat er vrijwel, of misschien helemaal, geen metazoekers zijn die de complete Google in het pakket hebben (zie hieronder).
- De categorisatie die metazoekmachines bieden wordt ook door veel zoekmachines zelf geboden. Voorbeelden zijn Teoma en Exalead. Dat neemt niet natuurlijk niet weg dat u een metazoeker ook kunt gebruiken om het resultaat van een of meer zoekmachines te categoriseren die zelf geen categorisatie bieden. Veel metazoekers bieden op z'n minst in de Advanced Search hun gebruikers de mogelijkheid zelf een keuze uit de te bevragen zoekmachines te maken.
- De meeste metazoekers hebben Google niet in het pakket zitten. Ik durf niet te beweren dat er niet één is die dat doet, maar ik weet wel dat er diverse metazoekers zijn die ten onrechte melden dat ze treffers in hun zoekresultaat bij Google halen. KillerInfo, Dogpile, Metacrawler en Zoeken.nl zijn daar voorbeelden van. Proef op de som: vergelijk Google met KillerInfo, Dogpile, Metacrawler en Vinden.nl, alle vier metazoekers die zeggen Google in het pakket te hebben. In werkelijkheid hebben ze wel resultaten van Google, maar die komen vermoedelijk bij Netscape of AOL vandaan, die een deel van Google's database gebruiken. Voor vragen met veel treffers is dit geen bezwaar, maar waar Google als enige een of een paar treffers heeft, mist u dus het een en ander.
- Veel metazoekers hebben geen of weinig benul van het feit dat het aantal zoekmachines met een eigen database niet zo groot is. Heel wat zoekmachines halen hun resultaten ergens anders, met als gevolg dat een metazoeker in zijn resultaat een treffer die uit één database komt maar door meer zoekmachines wordt gevonden, ten onrechte hoog in de ranking zet. Voor de hand liggende voorbeelden zijn AlltheWeb/Altavista, Looksmart/Wisenut, Google/AOL/Netscape en Ask Jeeves/Lycos. (Voor een, inmiddels al weer gedateerd overzicht van de ingewikkelde relaties tussen zoekmachines en de databases waar ze hun resultaten uit halen, zie de Search Engine Chart.) In alle gevallen dat u in het zoekresultaat van een metazoeker bij meer dan een treffer twee of meer zoekmachines met eenzelfde positie tegenkomt, is de kans groot dat u met resultaten uit één database te maken hebt.
- Iets waar je bij metazoekmachines ook altijd op moet letten is of ze de ontwikkelingen bij de achterliggende zoekmachines wel behoorlijk volgen. Een voorbeeld is de overgang van MSN Search van Inktomi naar een eigen database, aan het begin van dit jaar. Nu, een half jaar later, serveren KillerInfo, Mamma en Ithaki (met een rating van resp. 8, 9 en 10 van de Metasearch Guide) nog steeds de resultaten van de oude database, die MSN kennelijk ook nog altijd online heeft. Zie hier de resultaten op dezelfde vraag bij de nieuwe MSN Search.
- Meer in het algemeen vind ik de resultaten die metazoekmachines leveren te onbetrouwbaar. De hierboven genoemde metazoekers zijn in veel opzichten nog goede uitzonderingen: ze geven informatie over welke zoekmachines ze gebruiken, gebruiken die (meestal) ook en vermelden in het zoekresultaat de zoekmachines waar ze treffers vandaan hebben en de plaats die die treffers in de oorspronkelijke ranking innemen. Dat maakt ze nog enigszins controleerbaar. De meeste metazoekers verschaffen die informatie niet. Dat kan betekenen dat je morgen met andere zoekmachines zoekt dan vandaag, dat de metazoeker nog maar één zoekmachine aan het werk zet, dat alleen nog tweederangs zoekmachines worden bevraagd etc.
Reacties? Graag...


