Functie Google Yahoo! MSN Search Opmerking
Algemeen       Op deze pagina vindt u de zoekmogelijkheden van de drie grootste mondiale zoekmachines -- Google, Yahoo! en MSN Search -- bijeengebracht, met hier en daar een verwijzing naar speciale mogelijkheden van drie andere grote mondiale zoekmachines: Teoma/Ask Jeeves, Gigablast en Exalead.
Grote mondiale zoekmachines bieden veel mogelijkheden om informatie op het web te vinden, maar die zijn algemeen van aard. Om u een idee te geven van de talloze speciale zoekmogelijkheden die het web daarnaast biedt, verwijs ik hier naar een paar sites die zich richten op van alles wat hier buiten beschouwing blijft:
  • Choose the Best Search for Your Information Needs
  • Phil Bradley: Finding what you need with the best search engines
  • De gids Zoeken op het internet van Kris Claessens, blz. 61-63.
  • NoodleQuest - The Search Strategy Wizard
  • Guides To Specialized Search Engines (with Descriptions)
  • Help/Info Advanced Google Search Operators (zie ook: Google Guide: Making Searching Even Easier) Inktomi's Search Syntax; zie ook: Yahoo! Search Engine Review on Search Engine Showdown Web Search Help: Search Builder and advanced search options (zie ook MSN Search's WebLog : New Operators Explained)  
    Blogs Google Weblog (Aaron Swartz); zie ook: Google Blog, Inside Google - part of the Blog News Channel, New Google Blog - News and tips about Google, The Unofficial Google Weblog, Google Blogoscoped, Google Weblog - jeroen.com/weblog/, Nuzee: Google Weblog, Steve Johnston, the Google Blog of a Google Consultant, Google, Inc. News (Topix.Net), Google Interviews, GoogleGuy Says, GoogleGuy Says - Google Ranking Info, Zorgloob - Tout savoir sur Google, Google Blog referencement et moteurs. Yahoo! Search blog; zie ook: The Unofficial Yahoo! Weblog MSN Search's Weblog  
    Cijfers        
    Aantal geïndexeerde pagina's 8,8 miljard 8 miljard 7,1 miljard Volgens een studie van Gulli en Signorini, The Indexable Web is more than 11.5 billion pages.
    Maximale indexeeromvang htm, 101K of 513K
    txt, ca. 513K
    pdf, ca. 500K
    htm, ca. 524K
    txt, ca. 215K
    pdf, 33K
    htm, ca. 1Mb
    txt, ?
    pdf, 765K
    De enige zoekmachine met op dit punt eenduidige resultaten is Google: voor html-bestanden vind je hier twee limieten, 101K en 513K; vermoedelijk is Google bezig naar de hoogste lengte over te stappen. In het txt-bestand (8pilg10.txt in de directory http://www.gutenberg.org/dirs/etext04/ van het Gutenberg-project), Love's Pilgrimage van Upton Sinclair, dat volgens de summary 1Mb groot is, vond Google als laatste tekst nog de phrase: "sleep fled from him like a mistress spurned", de laatste zin van de cacheversie, die overeenkomstig Google's opgave ca. 513K lang is. Wat het pdf-bestand betreft vond Google nog de phrase "since the agent does not know exactly what observations" op blz. 98 van de 148, wat op een indexeerlengte van ca. 500K (in dit geval 153K platte tekst) wijst.
    Yahoo! vindt in Love's Pilgrimage van Upton Sinclair als laatste tekst nog de phrase "made me think of you as some old Viking's", wat op een indexeerlengte van ca. 215K wijst en niet van 525K, zoals Yahoo! zelf opgeeft; ca. 215K is ook de werkelijke omvang van de cacheversie. Wat het pdf-bestand betreft, de laatste phrase die Yahoo! daarin vindt, duidt op een indexeerlengte van ca. 33K platte tekst.
    MSN Search indexeert htm-documenten tot ca. 1 Mb, zoals uit de cacheversie van het ca. 2,6 Mb grote document blijkt. Wat het document in txt-formaat betreft, MSN-search heeft het wel in zijn database, maar er is geen tekst in te vinden. Het pdf-bestand, dat een omvang van ca. 765K heeft, heeft op de laatste van de 148 bladzijden nog de phrase "intensity increasing at each time", die door MSN gevonden wordt.
    NB: Het kan zijn dat de hier opgegeven getallen niet voor alle documenten gelden die de zoekmachines in hun database hebben.
    Maximale omvang zoekargument in het zoekvenster 32 zoektermen, placeholders (*) niet meegerekend; NB: deze beperking kan niet worden omzeild door de URL te manipuleren 100 tekens; NB: deze beperking kan worden omzeild door de URL te manipuleren of door een korte zoekvraag vanuit het resultatenscherm uit te breiden. onbeperkt, maar bij invoer van meer dan 10 termen (in phrases maximaal 24) vindt MSN het document niet meer URL-manipulatie: het veranderen van parameters in de URL van een resultatenpagina.
    Toont: nooit meer dan 1000 treffers nooit meer dan 1000 treffers maximaal ca. 250 treffers  
    Prefixen       Prefixen zijn wat je bij databases veldlabels of voorloopteksten zou noemen. Functioneel zou je ze beter limiters of qualifiers kunnen noemen, want hun functie is de algehele verzameling van documenten op het Web tot een deelverzameling te beperken. Je zou daarbij onderscheid kunnen maken tussen "documentbegrenzers" en "tekstbegrenzers". De eerste hebben betrekking op eigenschappen (adres, taal, bestandstype etc.) van het document als zodanig, de tweede op de interne indeling van de documenten. Zo is site: een documentbegrenzer, en intitle: een tekstbegrenzer. Een aantal prefixen -- zoals link: -- valt echter buiten deze boot.
    Documentbegrenzers        
    Sites die worden gehost door een opgegeven Internet Provider (IP-adres) n/a n/a ip: Kan met een zoekterm, al dan niet met een prefix, worden gecombineerd. Gebruik DNS Stuff City from IP of IP Routing Lookup om land en plaats bij een IP-adres te vinden; zie ook Fagan Finders URLinfo beta onder General. Zoeken op een IP-adres kan ook bij Gigablast. Daar kan ook een getrunceerd adres worden opgegeven, wat bij MSN search niet kan.
    De domain of host van het gezochte document
    (generieke en 'country code' TLD's, plus second level, third level etc.)
    site: site: of domain: site: Met site: beperkt u de vraag tot sites met een opgegeven -- generiek of "country code" -- TLD (Top Level Domain) of een (country code) domain op een lager (second level, third level etc.) niveau; gebruik de in de volgende rij genoemde mogelijkheden om niet alleen sites met een opgegeven ccTLD te vinden, maar ook die met een generiek TLD die met een bepaald land geassocieerd zijn.
    Het land waar het document op een server staat [Language Tools] [Advanced Search] loc: of location: (vgl.) Zie boven bij site:; loc: omvat ook de generieke TLD's die in een opgegeven land in gebruik zijn.
    De regio waar het document op een server staat n/a region: n/a Voor een overzicht van de beschikbare regio's en de landen die onder elke daarvan vallen, zie hier. Naast Yahoo! biedt ook Teoma de mogelijkheid met het prefix geoloc: naar regio's te zoeken.
    De computer waarop het opgegeven document staat n/a hostname: n/a hostname: bij Yahoo! doet niets wat site: niet ook kan.
    De taal van het document [Advanced Search, Preferences, Language Tools] [Advanced Search] language: Klik hier voor een lijst van taalcodes bij MSN Search. Naast MSN Search hebben ook Teoma (lang:) en Exalead een language:-prefix.
    Het type document (op basis van de file-extensie) filetype: of ext: originurlextension: filetype: Voor meer informatie over filetypes, zie Greg Notess' Fiddling with File Types, beslist de moeite van het lezen waard!; hoewel de diverse zoekmachines opsommen welke meest gebruikte filetypes ze indexeren, blijken dat er in de praktijk altijd meer (voorbeeld: OpenOffice.org .sxw) te zijn, voor een uitgebreid overzicht van filetypes, zie FILExt - The File Extension Source. Fagan Finder heeft een handige filetype-kiezer, Search by File Format (beta).
    De opgegeven term in de URL inurl: inurl: inurl: inurl: kan onder meer worden gecombineerd met site:; als zoekterm achter inurl: kan bij alle drie de zoekmachines ook een host + pad worden opgegeven.
    Alle opgegeven termen in de URL allinurl: n/a n/a allinurl: heeft betrekking op alle termen in de zoekvraag, vóór en na het prefix, zij het dat deze door OR met elkaar verbonden kunnen zijn; allinurl: duldt geen andere prefixen naast zich, met uitzondering van site:
    De opgegeven term in het pad n/a path: of originurlpath: n/a Het path omvat alle subdirectories, maar niet de host en geen bestandsnamen met een extensie
    Het (maximale) niveau waarop het gezochte document in de directorystructuur van een site te vinden moet zijn (mogelijke waarden 0-4) n/a depth: n/a De waarde 0 staat voor de eerste directory na de hostname; in het voorbeeld vindt Yahoo! pagina's waarin de gezochte term ofwel in de hostname voorkomt, ofwel in een bestandsnaam die er direct op volgt (inurl:, depth:0), maar niet in een path (-path:)
    De pagina met het opgegeven adres, evt. met extra informatie info: of id: url:http:// of originurl:http:// url: Google's info: of id: geeft toegang tot de cacheversie, eendere ("related") pagina's, pagina's die naar het opgegeven document linken, pagina's van de site waartoe de opgegeven pagina behoort, en pagina's waarin de opgegeven URL als link of als tekst voorkomt. Voor meer informatie over sites, zie Fagan Finders URLinfo beta
    Alleen pagina's met een Last Modified-datum binnen de opgegeven periode [Advanced Search] [Advanced Search] n/a Tot voor kort ondersteunde Google naast Date in de Advanced Search ook daterange:[datum uit de Juliaanse kalender], waarmee pagina's konden worden gevonden met een Last Modified date binnen een vrij door de gebruiker op te geven range. Dit lijkt niet meer te werken (de gekozen daterange is hier de periode 1-10 september 2001). Gebruik Teoma Advanced Search of de prefixen afterdate:[yyyymmdd], beforedate:[yyyymmdd] en betweendate:[yyyymmdd.yyyymmdd] voor een zoekactie van dit type die verder gaat dan de mogelijkheden die Google en Yahoo! bieden; zie Teoma's resultaat voor de mislukte zoekactie bij Google. Naast de hier genoemde mogelijkheden biedt Teoma ook nog het prefix last: gevolgd door day, #days, week, #weeks of year, #years
    Tekstbegrenzers        
    De opgegeven term in het titelveld intitle: title: of intitle: intitle: Yahoo! rekent ook termen die in de META keywords en description voorkomen tot de titel!; NB: gebruik bij voorkeur title: en niet intitle:
    Alle opgegeven termen in het titelveld allintitle: TITLEWORDS (...) n/a TITLEWORDS (...) is niet gedocumenteerd.
    De opgegeven term in de (body van de) tekst intext: n/a inbody: De body van de tekst is het gedeelte van een HTML-bestand tussen de tags <body> en </body>.
    Alle opgegeven termen in de (body van de) tekst allintext: n/a n/a allintext: bij Google heeft betrekking op alle termen in de zoekvraag, vóór en na het prefix, zij het dat deze door OR met elkaar verbonden kunnen zijn; allintext: duldt geen andere prefixen naast zich, met uitzondering van site:
    Pagina's met een of meer getallen binnen het opgegeven bereik numrange:[#-#] of: #..# n/a n/a Gebruik numrange: in alle gevallen waarin u vermoedt dat het te vinden document een getal bevat en u kunt gissen wat dat getal ongeveer is; in het algemeen is een getal een betere zoekterm dan een woord.
    Documenten waarnaar door andere documenten wordt verwezen onder een titel (het anker) die de opgegeven term bevat inanchor: n/a inanchor: inanchor: betreft het document waarnaar verwezen wordt (en dat de opgegeven term dus zelf niet hoeft te bevatten); dat document wordt gepresenteerd, niet het document dat de verwijzende tekst bevat (hoewel het die natuurlijk wel kán bevatten); NB: als u inanchor: meermalen in één zoekvraag gebruikt, kunnen de zoektermen uit diverse anchors op diverse pagina's komen!
    Documenten waarnaar door andere documenten wordt verwezen onder een titel (het anker) die de opgegeven termen bevat allinanchor: n/a n/a allinanchor: bij Google heeft betrekking op alle termen in de zoekvraag, vóór en na het prefix, zij het dat deze door OR met elkaar verbonden kunnen zijn; allinanchor: duldt geen andere prefixen naast zich, met uitzondering van site:; NB: allinanchor: houdt niet in dat alle daarbij gebruikte zoektermen in één anchor of zelfs diverse anchors op één pagina moeten voorkomen!
    Pagina's met een of meer verwijzingen (links) naar een opgegeven MIME-type n/a outgoingurltype: n/a Voor een overzicht van MIME-types, zie Mimetypes.
    Pagina's met een of meer verwijzingen naar (een) bestand(en) met een bepaalde extensie n/a linkextension: contains: Voor een uitgebreid overzicht van file extensions, zie FILExt - The File Extension Source.
    Pagina's met een opgegeven kenmerk (script, form, table etc.) of een link naar een opgegeven bestandstype of formaat n/a feature: n/a Yahoo! heeft dit prefix geërfd van de Inktomi-databases; er zijn tal van features, die bij elkaar een beeld geven van alles wat er op het web te koop is, voor zover HTML-pagina's daar toegang toe verschaffen. Op zoek naar plaatjes die u niet bij Google of Yahoo! Images kunt vinden? Combineer een zoekterm (evt. in een titel) met de opdracht feature:image en met wat geluk vindt u een foto bij de webpagina's die over het onderwerp gaan; op zoek naar databases van het onzichtbare web? Combineer een zoekterm met feature:form, wat wil zeggen dat u zoekt naar pagina's met een regel of een formulier waarin bezoekers iets kunnen invullen. Voor een uitgebreide lijst van de mogelijkheden van feature: zie Inktomi's search syntax.
    Documenten die een definitie van de opgegeven term bevatten define: n/a n/a Hiermee is hier niet bedoeld de woordenboekfunctie die alle drie de grote zoekmachines als shortcut hebben, waarbij de opgegeven term in Answers.com (Google), Yahoo! Education (Yahoo!) of Encarta (MSN Search) wordt opgezocht, maar een zoekactie naar de opgegeven term, beperkt tot sites waar definities van termen worden gegeven.
    Operatoren       Hiertoe reken ik alle middelen die de relatie tussen zoektermen besturen: unitaire en Booleaanse operatoren, phrases, nabijheidsoperatoren, nesting, stemming en truncatie (deze twee omdat ze een patroon gebruiken om een impliciete OF-relatie tussen diverse termen leggen die aan dat patroon voldoen) en "term weighting", waarbij het belang van de ene zoekterm ten opzichte van de andere wordt gemanipuleerd.
    Unitair verplicht aanwezig ("must contain") + (vgl.); ander gebruik: + (vgl.) + + Door het standaardgebruik van de impliciete EN-relatie tussen zoektermen heeft de unitaire operator + bij de drie hier vergeleken grote zoekmachines merendeels andere functies gekregen dan het verplicht stellen van de term waaraan hij voorafgaat. Bij Google dient de +-operator ter precisering: om een zoekactie met een geaccentueerde term tot de geaccentueerde vorm te beperken, en om automatic stemming uit te schakelen. + hoeft bij Google niet meer te worden gebruikt om stopwoorden in phrases in de zoekactie mee te nemen. Bij Yahoo! hoeft dat ook niet, en voor zover mij bekend heeft + bij Yahoo! geen nuttige functie; wel maakt het gebruik van + verschil voor de ranking als dat bij stopwoorden buiten phrases gebeurt: de ranking wordt dan anders, net zoals trouwens ook bij Google het geval is. Bij MSN Search speelt de + geen enkele rol.
    Unitair verplicht afwezig ("must not contain") - - - De min-operator kan zowel met een term als met een phrase worden gecombineerd. Voeg elke term die u wilt uitsluiten in de impliciete EN-relatie toe met het min-teken ervoor. NB: De Search Builder van MSN bouwt een zoekvraag met meer minnen als volgt op: boerenkoolvoetbal -(doelpunt -ploeg -trainer). Dat geeft een onjuist resultaat, vgl. boerenkoolvoetbal -doelpunt -ploeg -trainer.
    Unitair facultatief aanwezig ("should contain") n/a n/a prefer: Behalve MSN Search ondersteunt ook Exalead deze "Best match" zoekmogelijkheid met de operator OPT. Teoma Advanced wekt ten onrechte de indruk "best match" te ondersteunen. (hetzelfde geldt voor Ask Jeeves Advanced)
    Impliciet EN [voorbeeld] [voorbeeld] [voorbeeld] Dit is de standaard voor alle grote zoekmachines.
    Booleaans EN n/a AND AND (&) Theoretisch zou er nog een verschil in ranking kunnen bestaan tussen impliciet en Booleaans EN. In de praktijk van de hier behandelde zoekmachines is dat niet zo. Dat Google geen AND ondersteunt, heeft alleen consequenties bij nesting. NB: Schrijf de Booleaanse operatoren altijd in hoofdletters. Ook al vereist niet iedere zoekmachine of database dat, het helpt u uw vraag te structureren.
    Booleaans OF OR OR OR (|) Schrijf de Booleaanse operatoren altijd in hoofdletters. Ook al vereist niet iedere zoekmachine of database dat, het helpt u uw vraag te structureren.
    Booleaans NIET n/a NOT (AND NOT) NOT Als u meermalen NOT gebruikt, moet dat bij Yahoo! in de vorm: boerenkoolvoetbal NOT (doelpunt OR ploeg OR trainer), niet in de vorm: boerenkoolvoetbal NOT doelpunt NOT ploeg NOT trainer; bij MSN Search moet dat in de vorm: boerenkoolvoetbal NOT doelpunt NOT ploeg NOT trainer, en niet in de vorm boerenkoolvoetbal NOT (doelpunt OR ploeg OR trainer) NB: Schrijf de Booleaanse operatoren altijd in hoofdletters. Ook al vereist niet iedere zoekmachine of database dat, het helpt u uw vraag te structureren.
    Nesting n/a [voorbeeld1], [voorbeeld2], [voorbeeld3], [voorbeeld4] [voorbeeld1], [voorbeeld2], [voorbeeld3], [voorbeeld4] (vgl.) [voorbeeld1], [voorbeeld2], [voorbeeld3], [voorbeeld4] Nesting is het gebruik van haakjes in een zoekvraag met diverse Booleaanse operatoren waardoor het computerprogramma opdracht wordt gegeven bewerkingen uit te voeren in een andere dan de standaardvolgorde. Doorgaans is die standaardvolgorde NOT, AND, OR: in een Booleaanse vraag worden eerst de NIET-bewerkingen uitgevoerd, dan de EN-bewerkingen en ten slotte de OF-bewerkingen. Door het gebruik van haakjes kan die standaardvolgorde worden doorbroken, net zoals dat bij wiskundige bewerkingen kan waarin optellingen, aftrekkingen, vermenigvuldigingen etc. voorkomen. In de vraag: mensen EN klonen OF kloneren zou de standaardvolgorde van bewerkingen zijn: eerst: mensen EN klonen (=set 1), daarna OF (is set 1 uitbreiden met) kloneren (=set 2). Het eindresultaat is set 3, bestaande uit treffers over het klonen van mensen, plus treffers over kloneren in het algemeen. Dit is duidelijk niet de bedoeling: vandaar dat door middel van nesting wordt aangegeven dat eerst de OF-relatie moet worden uitgevoerd: mensen EN (klonen OF kloneren). Klonen OF kloneren wordt nu set 1, mensen set 2, en set 1 verkleind met set 2 (EN) wordt set 3.
    Google werkt anders: tussen termen bestaat een impliciete EN-relatie, die automatisch haar prioriteit verliest als twee termen (of phrases) in de zoekvraag met een OR verbonden worden; deze OR-relatie geldt dan alleen voor de twee zoektermen (of phrases) aan weerszijden van de OR-operator. Voor een simpele vraag als mensen klonen OR kloneren is nesting dus niet nodig, omdat de OF-bewerking hier automatisch eerst wordt uitgevoerd, en daarna de impliciete EN-bewerking. Dat gaat ook op als er meer OF-bewerkingen in een zoekvraag zijn: apen OR stieren klonen OR kloneren.
    Een probleem krijgt Google pas met een vraag waarbij een EN-bewerking prioriteit zou moeten krijgen boven een OF-bewerking: salmons cloning OR genetic engineering. In de interpretatie van Google is set 1 hier cloning OR genetic, en wordt deze vervolgens verkleind met set 2, salmons, en set 3, engineering; het eindresultaat is, in volgorde van bewerkingen: cloning OR genetic AND salmons AND engineering. Doordat Google de combinatie genetic engineering bij het ranken als een phrase blijft behandelen, is bij de eerste treffers niet direct zichtbaar dat het resultaat niet het verwachte is; dat dat toch zo is, blijkt als we genetic engineering tot een phrase maken: salmons cloning OR "genetic engineering". Dat dit resultaat kleiner is dan bij de vraag zonder de phrase, komt doordat daar aan de treffers die de term cloning bevatten ook nog de extra eis wordt gesteld dat ze engineering moeten bevatten.
    Uit de bij Google gegeven voorbeelden mag blijken dat het gebruik van phrases en placeholders in phrases het gebrek aan Booleaanse nesting voor een deel kan compenseren; een phrase is immers een speciale manier om een EN-relatie te leggen die prioriteit heeft boven OF-bewerkingen. Zonder de phrase zou de hierboven vermelde vraag met Booleaanse nesting overigens luiden: salmons AND (cloning OR genetic AND engineering): ook binnen de haakjes blijft de computer de EN-relatie tussen genetic en engineering standaard prioriteit geven boven de OF-bewerking.
    Voor een overzicht van Google's combineermogelijkheden, zie Search Engine Showdown Analysis: Boolean Searching on Google.
    Voorbeeld 4 maakt duidelijk dat nesting ook prefixen kan omvatten. Wel dient u er bij Yahoo! op te letten dat als u nest met een OF-relatie tussen twee of meer zoektermen, de AND-operator expliciet moet worden gebruikt voor de EN-relaties!
    De opgegeven zoektermen als phrase "..." "..." "..." Google accepteert phrases (en niet-phrases) van tot en met 32 termen (placeholders [*] niet meegeteld) en verwaarloost het meerdere; Yahoo! heeft geen of een heel hoge limiet; MSN Search accepteert in phrases tot en met 24 termen (buiten phrases maximaal 10) en geeft een nulresultaat als u er meer gebruikt.
    Een willekeurige term binnen een phrase ("placeholder") * n/a n/a Google is de enige zoekmachine die placeholders ondersteunt; bij Yahoo! kon daar vroeger een stopwoord voor worden gebruikt, maar dat werkt niet meer. Google accepteert meer dan een placeholder (achter elkaar of op verschillende plaatsen) binnen een phrase; placeholders tellen niet mee voor de limiet van 32 termen in één zoekvraag die Google hanteert.
    Proximity operators nabijheid van termen is een van de factoren die een rol spelen in het ranking algoritme nabijheid van termen is een van de factoren die een rol spelen in het ranking algoritme nabijheid van termen is een van de factoren die een rol spelen in het ranking algoritme Exalead heeft een NEAR-operator, die pagina's zoekt in een afstand van maximaal 16 woorden van elkaar, maar het gebruik van deze operator is niet zonder problemen.
    De opgegeven term, plus de termen waarin de opgegeven term een woordstam is ([automatic] stemming) (in beperkte mate automatisch; gebruik +[term] om automatic stemming uit te schakelen; voorbeelden [let op de vet weergegeven termen]: 1, 2, 3, 4) stem: n/a Google past in sommige gevallen -- en alleen bij meer dan één zoekterm -- automatic stemming toe; net als Google ondersteunt de zoekmachine Exalead automatic stemming, maar op meer uitgebreide schaal en enkel wel/niet voor alle zoektermen in de zoekvraag.
    Truncatie n/a n/a n/a Niet een van de grote zoekmachines biedt de mogelijkheid tot trunceren. Gebruik daarvoor Exalead, dat zowel rechts trunceren met * mogelijk maakt, als zoeken met regular expressions
    De opgegeven term, plus gerelateerde termen ~ n/a n/a Ask Jeeves heeft suggesties voor gerelateerde termen onder Expand your search in het resultatenscherm van een zoekactie met één term. Zie ook onder Categorisatie.
    Term weighting Plaats term voorop (vgl.); herhaal term (vgl.) Plaats term voorop (vgl.); 0.1-9.9*[zoekterm] (vgl.) n/a Door de hier vermelde mogelijkheden te gebruiken geeft u de zoekterm waarop de bewerking wordt toegepast meer (of in het geval van Yahoo! evt. ook minder) gewicht dan andere termen in de zoekvraag. De kleinere zoekmachine Gigablast gebruikt het teken | om treffers die alle zoektermen bevatten op de term na | te sorteren. Vgl. voeding | kanker met kanker | voeding.
    Sorteermiddelen       Behalve MSN Search biedt vrijwel geen enkele zoekmachine zijn gebruikers de mogelijkheid een andere dan de standaard sortering op het zoekresultaat toe te passen.
    Sorteer op actualiteit (Last Modified) n/a n/a {frsh=[0-100]} Vindt veel blogs, nieuwsbrieven, etc.; naast MSN Search biedt ook Exalead een sort:new / sort:old mogelijkheid. Maar daarnaast kunt u ook overwegen speciale nieuws-/blog-zoekmachines, zoals Google News, Yahoo! News, RocketNews, Feedster, BlogPulse en Technorati te gebruiken.
    Sorteer op populariteit n/a n/a {popl=[0-100]} Controleer het resultaat door met link: de pagina's te tellen die naar de volgens MSN Search populairste pagina's over de opgegeven zoekterm(en) linken. Vgl. Hubs en authorities hieronder.
    Sorteer op relevantie n/a n/a {mtch=[0-100]} Naar mijn mening heeft MSN Search hier Exact match en Approximate match met elkaar verwisseld: {mtch=100} zou moeten betekenen dat de overeenkomst tussen zoekvraag en eerst gepresenteerde documenten maximaal is (Exact match).
    Overige        
    De documenten die verwijzen (linken) naar de opgegeven pagina link: link:http:// link: (of link:http://) link: bij Google geeft maar een beperkt aantal resultaten en kan niet met andere zoektermen of prefixen (bij voorbeeld: site: link:) worden gecombineerd; bij Yahoo! en MSN Search kan dat wel; interessante toepassingen zijn onder meer: link:[URL 1] link:[URL 2] etc. om "hubs" (pagina's met veel outgoing links) te vinden; link:http://[URL 1] -site:[de site waartoe de pagina behoort] om alleen de links van buiten te vinden. Voor meer mogelijkheden om naar verwijzende pagina's te zoeken, zie Fagan Finders URLinfo beta onder Links.
    De documenten die verwijzen (linken) naar alle pagina's binnen het opgegeven domain n/a linkdomain: linkdomain: linkdomain: kan zowel bij Yahoo! als bij MSN Search met andere termen en prefixen worden gecombineerd.
    Pagina's die eender (similar) zijn aan de pagina met het opgegeven adres related: n/a n/a Google's related: kan niet met andere termen of prefixen worden gecombineerd. Voor meer mogelijkheden om naar eendere pagina's te zoeken, zie Fagan Finders URLinfo beta onder Similar. Exalead biedt de mogelijkheid via Related categories door te klikken naar andere sites die in eenzelfde rubriek van het ODP zijn ondergebracht.
    Webpagina's vertalen [link Translate this page in resultatenlijst]; daarnaast via [Google Language Tools] [link Translate this page in resultatenlijst] n/a Voor meer vertaalmogelijkheden, zie Fagan Finders Translation Wizard (beta) en Free Online Language Translation.
    De cachekopie van het document met de opgegeven URL cache: [link Cached in resultatenlijst] [link Cached page in resultatenlijst] Voor een overzicht van mogelijkheden om oudere kopieën van webpagina's te vinden, zie Fagan Finders URLinfo beta, onder de tab Cache.
    Overigens is de ene cachekopie de andere niet. Vgl. de lengte van die van Google met die van Yahoo!.
    Zoeken in natuurlijke taal How high is the second-highest mountain in the world?

    Who is the current secretary-general of NATO?

    How many species of tarantula are there?

    Which part of Aristotle's Ars Poetica is lost?

    When was the library of Alexandria destroyed?

    What does Parkinson's second law say?

    What is the title of Dan Brown's first novel?
    How high is the second-highest mountain in the world?

    Who is the current secretary-general of NATO?

    How many species of tarantula are there?

    Which part of Aristotle's Ars Poetica is lost?

    When was the library of Alexandria destroyed?

    What does Parkinson's second law say?

    What is the title of Dan Brown's first novel?
    How high is the second-highest mountain in the world?

    who is the current secretary-general of NATO?

    How many species of tarantula are there?

    Which part of Aristotle's Ars Poetica is lost?

    When was the library of Alexandria destroyed?

    What does Parkinson's second law say?

    What is the title of Dan Brown's first novel?
    Vergelijk deze resultaten met die van Ask Jeeves (Teoma):

    How high is the second-highest mountain in the world?

    Who is the current secretary-general of NATO?

    How many species of tarantula are there?

    Which part of Aristotle's Ars Poetica is lost?

    When was the library of Alexandria destroyed?

    What does Parkinson's second law say?

    What is the title of Dan Brown's first novel?
    Hubs en authorities n/a n/a Sorteer op popularity (authorities) Hubs en authorities zijn kort gezegd sites met resp. veel uitgaande en veel inkomende links. Hoewel het rankingalgoritme van Google aan beide een zeker gewicht toekent, zijn er zoveel andere factoren die de ranking beïnvloeden, dat je met Google niet op een enigszins systematische manier hubs en authorities kunt identificeren. Voor de authorities zou dat in theorie wel met MSN Search moeten kunnen door in de Search Builder de slider voor popularity naar het hoogste punt te slepen en de andere twee sorteeropties op nul in te stellen. Maar in de praktijk is onduidelijk waarop de populariteitsranking van MSN Search gebaseerd is. Met de vraag "forensic psychiatry" {popl=100} is het aantal inkomende links van de eerste twaalf treffers als volgt: 6, 65, 3103, 19, 1456, 12.206, 9, 4556, 4, 30, 2, 19.299. Vergelijk dit met de aantallen inkomende links van de treffers op de plaatsen 250-239: 4, 5, 2, 26, 11, 43, 88, 2, 32, 15, 2, 10.
    Hubs zijn met de zoekmachine Teoma op te sporen, die daarbij over "link collections from experts and enthusiasts" spreekt. De zoekvraag "Forensic psychiatry" levert hier tien van zulke "link collections" op, met resp. de volgende aantallen uitgaande links: 58, 92, 101, 102, 182, 85, 103, 443, 46 (één pagina was een dode link).
    Het belang van zulke aantallen uitgaande links voor het opsporen van hubs wordt gerelativeerd doordat de echt grote hubs hun links in een database hebben.
    Spellingsuggesties [voorbeeld1], [voorbeeld2], [voorbeeld3] [voorbeeld1], [voorbeeld2], [voorbeeld3] [voorbeeld1], [voorbeeld2], [voorbeeld3] Van de drie hier genoemde zoekmachines heeft Google zonder twijfel verreweg de beste spellingchecker. Dislektisi die aan Google niet genoeg hebben, kunnen de Advanced Search van Exalead proberen, met de daar onder Search method beschikbare Phonetic search en Approximate spelling.
    Categorisatie, suggesties voor meer / andere / specifiekere zoektermen n/a [voorbeeld] n/a Teoma (Refine) / Ask Jeeves (Narrow Your Search en Expand Your Search), Gigablast (Gigabits) en Exalead (Related terms en Related Categories) bieden diverse voorzieningen.
    Gerelateerde namen n/a n/a n/a Ask Jeeves laat bij het zoeken met de namen van bekende personen, functies, werken, gebeurtenissen, e.d. in de rechter marge van het resultatenscherm "Related Names" zien.
    RSS feeds n/a via link "View as XML" bij treffers die een feed bieden via RSS-knop onderaan resultatenpagina Van de drie grote mondiale zoekmachines is MSN Search de enige die zijn resultatenpagina's als RSS-feed verschaft. Dat betekent dat de feed van zo'n pagina in een RSS-reader kan worden geplakt, waarna nieuwe resultaten van de zoekactie met de door u opgegeven frequentie als koppen in dat programma verschijnen.
    Yahoo! doet het anders. Als tussen de resultaten sites zitten die feeds ondersteunen, wordt bij de treffer een link met de tekst "View as XML" aangeboden, waarna het adres van het XML-bestand in de RSS-reader kan worden geplakt. Nieuwe items vooor die site worden dan als koppen in de RSS-reader getoond.
    Local search via Google Local via Yahoo! Local Geef onder Settings bij Location een plaatsnaam op waarvoor u lokale resultaten wilt zien, en zoek vervolgens met de knop Near me. Gebruik voor Nederland: Wijsvinger.