Nogmaals de Nationale Krakercompetitie
De afgelopen week is vrijwel geheel naar de Nationale Krakercompetitie gegaan, en waar het hart vol van is, daar loopt de mond van over. Vandaar dat ik het niet kan laten u nogmaals een kijkje in de keuken van de Nationale Krakercompetitie te geven.
Momenteel zitten mijn collega-redactieleden, betatesters en ik midden in de fase van het opstellen, uittesten en controleren van de vragen. Hoe gaat dat? Ik voor mij begin al met het verzamelen van materiaal voor vragen in de aanloop tot de krakercompetitie van het voorafgaande jaar. Dat is namelijk een tijd waarin je veel websites tegenkomt die je anders nooit zult zien, en bovendien ben je er extra op gespitst in die websites de elementen voor een mogelijke vraag te onderkennen. Maar niet alleen het Web zelf inspireert tot vragen, want ook beelden die je op de tv ziet, berichten in kranten of passages in boeken kunnen een aanleiding vormen eens na te gaan of er geen aardige vraag in zit. Om maar een voorbeeld te noemen dat het niet tot een vraag gehaald heeft, tijdens een bezoek aan Londen onlangs kocht ik in het Sir John Soane's Museum een boekje over dat museum, waarin wordt vermeld dat de bekende Engelse 'K2' telefooncellen uit de jaren 1920 uiteindelijk geïnspireerd zijn door de Tempel van Vesta in Tivoli (zie: http://www.caad.ed.ac.uk/courses/history/handouts/AH1_handout30.html).
Een belangrijk criterium bij de beoordeling of een onderwerp geschikt is voor een vraag is naast de interessante aard en/of de curiositeit van het onderwerp de vraag hoe gemakkelijk een vraag op te lossen zou zijn. Onze ervaringen bij vorige afleveringen van de Nationale Krakercompetitie hebben ons geleerd dat er in een wereld van fulltext oneindig veel wegen naar Rome zijn. Met andere woorden, deelnemers aan de competitie vinden de antwoorden op onze vragen met zoektermen die we zelf niet hadden kunnen bedenken. Dit verschijnsel -- en dan speciaal het feit dat zoekmachines zoals Google de sites die die antwoorden geven op de een of andere manier toch hoog in de resultatenlijst vertonen -- vervult mij steeds weer van een zeker ontzag voor de "intelligentie" die de makers van de fulltext-zoeksoftware aan hun producten weten mee te geven.
Een van de manieren om dit probleem te vermijden is om uit te wijken naar het Invisible Web. Zelfs dat is er de laatste jaren niet eenvoudiger op geworden, want zoekmachines als die van Google en Yahoo! dringen steeds verder in databases door. Niettemin zijn er, mede dank zij allerlei digitaliseringsprojecten van overheden en wetenschappelijke instellingen, nog altijd heel wat sites die maar beperkt door de grote zoekmachines ontsloten worden. Een van de redenen daarvan kan zijn dat daar geen HTML- of PDF-bestanden worden getoond, maar plaatjes van tekst. Met zulke tekst kan een zoekmachine (nog) niets. Dit onzichtbare Web is vanaf het begin een domein waar een deel van de antwoorden op de vragen van de Nationale Krakercompetitie gezocht moet worden. Als ik in dit verband Het Geheugen van Nederland noem, verklap ik geen geheim.
Een van de grootste problemen die deelnemers bij het oplossen van vragen tegenkomen, is dat ze niet weten of het antwoord op een vraag op het zichtbare -- door de grote zoekmachines geïndexeerde -- Web te vinden is, dan wel op het onzichtbare Web moet worden gezocht. Meestal zal de neiging bestaan om op het zichtbare Web te beginnen; en meestal is dat ook een goede keus, omdat het zichtbare Web vrijwel altijd een toegang tot het onzichtbare Web ontsluit. Een probleem daarbij is natuurlijk wel dat de 'voordeur' tot een bestand doorgaans met veel algemenere zoektermen moet worden gevonden dan wat achter die voordeur schuilgaat. Toch kan het feit dat bij een zoekactie met meer specifieke zoektermen in Google of Yahoo! records uit een bepaalde database beginnen op te duiken, deelnemers naar het bestand leiden waar het antwoord te vinden is, ook al is dat met Google of Yahoo! zelf niet te vinden.
Als het antwoord op een vraag met Google of Yahoo! (etc.) niet te vinden is en men is tot de slotsom gekomen dat op het onzichtbare Web zal moeten worden gezocht, waar op het onzichtbare Web moet men dan beginnen? Het aantal databases, archieven, beeldbanken en wat niet al is onoverzienbaar, en hoewel de meeste deelnemers de bekendste wel kennen, zijn voor de redactie in de minder bekende nog tal van leuke vragen te vinden. Maar ook hier voelen wij ons wel aan grenzen gebonden. Een volstrekt onbekende database, waarnaar, in een verband met de vraag, door vrijwel niemand op het Web gelinkt wordt, wordt door ons niet voor vragen gebruikt. Anders gezegd, databases op het onzichtbare Web die wij voor vragen gebruiken, moeten wel op een aanvaardbare manier op het zichtbare Web te vinden zijn -- via een grote zoekmachine, een directory, een startpagina of, in laatste instantie, intuïtief. Met dat laatste bedoel ik dat van een goede zoeker mag worden verwacht dat hij informatie zoekt bij instellingen waarvan te verwachten valt dat ze die informatie verschaffen.
Om een voorbeeld te noemen: een van de vragen van vorig jaar ging over een archieffoto van een Australische schilderes, Margaret Coen, die in de Australische pendant van Het Geheugen van Nederland te vinden was. Dan mag je verwachten dat een goede zoeker die database ook bij de Australische nationale bibliotheek of bij het nationaal archief gaat zoeken. Overigens bleek tot mijn verrassing en -- ik beken het maar -- teleurstelling dat de googelaars ook daarheen weer een weg gevonden hadden.
Vragen die in de Nationale Krakercompetitie worden gesteld zijn meestal geen echte vragen. Dat is niet alleen zo omdat de makers de antwoorden al weten, maar ook omdat een groot aantal van de vragen vanuit het antwoord terug geredeneerd is: de redactieleden hebben een aardig onderwerp gevonden, dat zich voor een vraag leent (bijvoorbeeld doordat persoonsnamen op verschillende manieren gespeld kunnen worden), en proberen dan een begaanbare route te construeren die van vraag naar antwoord leidt. Die route wordt vervolgens verpakt in de vraagstelling, waarin bij voorkeur ook een flink aantal dwaalwegen zijn ingebouwd. Toch zijn er ook wel vragen die door de redactieleden zelf eerst tot een oplossing zijn gebracht alvorens ze in de Krakercompetitie terechtkomen. Bij de analyse van dat soort vragen blijkt trouwens meestal ook dat door de redactieleden heel wat dwaalwegen bewandeld zijn voordat men zelf het antwoord vond. In dat opzicht zijn alle krakervragen dus wel tot op zekere hoogte realistisch. Onrealistisch, maar wel prettig voor de deelnemers is daarentegen het multiple-choicekarakter van de Krakercompetitie. Bij de eerste aflevering werden de drie of vier antwoorden nog voluit geschreven, waardoor de diverse opties mede als zoekterm konden worden gebruikt. Tegenwoordig werken we in veel gevallen met eerste letters e.d. van antwoorden. Dat lost het probleem van multiple choice voor een deel op, maar biedt geen soelaas tegen gokkers, die immers een uit vier mogelijkheden kunnen kiezen.
De Nationale Krakercompetitie kost de deelnemers heel veel tijd -- als het u om de prijzen gaat, kunt u beter aan een tv-spelletje mee gaan doen. Dat toch nog duizenden mensen meedoen, heeft naar mijn indruk voor een deel te maken met de ambitie de beste zoeker te willen zijn. Daarnaast speelt natuurlijk ook het jagersinstinct -- niet voor niets is een van de termen voor het fenomeen "internet hunt" -- een rol. Niettemin probeert de redactie hier nog een educatief element aan toe te voegen. Voor sommige redactieleden bestaat dat, zoals gezegd, in rondleidingen langs interessante sites, over interessante onderwerpen, wat mijzelf aangaat, ik probeer in de vragen ook iets educatiefs over het gebruik van zoekmachines onder te brengen. In veel gevallen blijkt dat overigens verspilde moeite. De deelnemers vinden het antwoord langs andere wegen.
Om u alvast een beetje in de stemming te brengen, hier een vraagje: hoeveel letters telt het langste Duitse woord dat met een e begint en met een g eindigt?
A. 28
B. 37
C. 42
D. 33
E. een ander aantal



0 Reacties:
Een reactie plaatsen
<< Home