Nederlandse proefschriften
Ruim een maand geleden zag ik in NRC Handelsblad een bericht waarin de beschikbaarheid van de Nationale Proefschriften Site werd gemeld. Het leek me de moeite waard om die site vanuit het perspectief van een informatiespecialist eens wat nader te bekijken en wat ervaringen met u te delen.
Wat is de Nationale Proefschriften Site?
De Nationale Proefschriften Site maakt deel uit van het SURF-programma DARE (Digital Academic Repositories) dat wereldwijd toegang geeft tot Nederlandse wetenschappelijke onderzoeksresultaten. Het essentiële begrip is hier “toegang geeft”: DARE is niet een soort centraal magazijn of archief van wetenschappelijke publicaties, maar veeleer een collectieve catalogus die het mogelijk maakt die publicaties aan de hand van een aantal zoekcriteria in de diverse “repositories” of elektronische bewaarplaatsen van die publicaties bij de diverse wetenschappelijke instellingen te lokaliseren. Evenzo is de Nationale Proefschriften Site geen centraal magazijn of archief van alle Nederlandse dissertaties, maar kan worden gekarakteriseerd als een collectieve catalogus van dat deel van de aan Nederlandse universiteiten geaccepteerde dissertaties dat (mede) in digitale vorm beschikbaar is. De dissertaties zelf berusten in repositories van die universiteiten zelf.
Volgens de FAQ van de site neemt het percentage proefschriften dat ook in digitale vorm beschikbaar is ieder jaar toe en bedroeg in 2005 bijna 60. Dat de meer dan 1600 digitale proefschriften voor heel Nederland voor dat jaar die nu via DARE te vinden zijn via deze catalogus vindbaar worden gemaakt is een goede zaak. Voor het vinden van Nederlandse dissertaties die je meteen kon inzien hadden we vroeger de catalogi van de universiteitsbibliotheken, maar dat is verleden tijd sinds die bibliotheken de proefschriften van andere Nederlandse universiteiten niet meer systematisch aanschaffen. Zo heeft het kunnen gebeuren dat in de catalogus van de UB Leiden nog maar 114 Groningse proefschriften over 2005 te vinden zijn, terwijl DARE over datzelfde jaar toegang tot 186 alleen al elektronische dissertaties geeft.
In totaal biedt DARE nu toegang tot meer dan 10.000 proefschriften van ongeveer de afgelopen twintig jaar. Dat in de universitaire repositories echter ook nog oudere, achteraf gedigitaliseerde proefschriften opgenomen kunnen zijn, bewijzen twee Leidse dissertaties van het eind van de 16e eeuw. En ook in Utrecht zijn een aantal juweeltjes van vóór 1950 te vinden.
Toegang
De Nationale Proefschriften Site is een catalogus, die niet de dissertaties zelf ontsluit, maar alleen beschrijvingen daarvan. Die beschrijvingen haalt DARE op uit de metadata die door de deelnemende universiteiten aan de proefschriften worden toegekend. Een voorbeeld van een record in zijn oorspronkelijke vorm vindt u hier, de metadata waarin de catalogussoftware van DARE zoekt vindt u hier. Je vindt die metadata door bij een gevonden titel op “bibliografische informatie” te klikken.
Naast auteursnaam en titel van het proefschrift vormen trefwoorden en de samenvatting of het abstract van de beschrijving de belangrijkste ingangen. Daarbij is het goed te bedenken dat de samenvatting/het abstract niet noodzakelijk hetzelfde is als de summary of samenvatting in het proefschrift zelf; in veel gevallen beslaat dit ettelijke bladzijden, terwijl de samenvatting die in de metadata wordt gebruikt niet meer dan een halve bladzijde beslaat. Daarin wordt dan de inhoud van het hele proefschrift samengevat, niet zoals vaak in de summary of ook de conclusion van het proefschrift zelf, ook de inhoud van de afzonderlijke hoofdstukken. Maar er zijn ook gevallen waarin de hele summary van het proefschrift in het record is overgenomen, en er zijn gevallen waarin het proefschrift wel een Engelstalige summary bevat, maar in het record geen samenvatting beschikbaar is. Ten slotte komt het nogal eens voor dat de bibliografische informatie niet kan worden bekeken omdat de server met een foutmelding komt.
Deze situatie leidt vanzelfsprekend tot een zeer grote differentiatie van de vindbaarheid van de door DARE ontsloten proefschriften: sommige zijn praktisch gesproken alleen op titelwoorden vindbaar, andere niet alleen daarop, maar ook op diverse trefwoorden en woorden uit de kortere of langere samenvatting.
De verschillen in de beschrijvingen waarin de DARE-software zoekt zijn niet de enige die de vindbaarheid beïnvloeden. Daarnaast blijkt dat ook het begrip trefwoorden bij de verschillende repositories op verschillende manieren wordt uitgelegd. Kun je bij een Gronings proefschrift de trefwoorden Onderwijsvernieuwing Buitenschoolse vorming, Hulpverlening, Basisonderwijs, Voortgezet onderwijs, ontwikkeling van het onderwijs aantreffen, in Utrecht kom je bij een medisch proefschrift naast geneeskunde de Engelse trefwoorden cartilage, tissue engineering, joint homeostasis, cartilage repair, mechanical factors, age, cell proliferation, chondrogenesis en cartilage formation tegen; ook de samenvattingen zijn in het Engels of in het Nederlands, zodat zoeken op de Proefschriftensite met zowel Engelse als Nederlandse termen raadzaam is.
Natuurlijk is dit alleen van belang als je op onderwerp naar Nederlandse proefschriften zoekt, niet bij gekend-itemzoeken.
Dit alles in aanmerking genomen valt het te begrijpen dat zoeken via DARE in essentie free-text zoeken is; alleen de auteursnaam (met automatische truncatie rechts), het promotiejaar en de universiteit waaraan de promotie heeft plaatsgevonden zijn als aparte zoekingangen beschikbaar. Men vindt die op de Advanced Search-pagina.
Hier, en ook in de Simple search, kunnen een of meer zoektermen worden ingevuld. Het is zelfs mogelijk Booleaanse operatoren en nesting te gebruiken om de zoekvraag zo efficiënt en precies mogelijk te stellen.
Sorteren kan op twee manieren: op auteur en aflopend op jaar.
Heeft men eenmaal een proefschrift van zijn gading gevonden, dan kan dit uit de repository van de betreffende universiteit naar de eigen PC worden gekopieerd. Alle proefschriften zijn in PDF-formaat, wat betekent dat de Acrobat reader of vergelijkbare software nodig is om ze te lezen. Wat men er verder mee kan – erin zoeken, eruit kopiëren etc. -- hangt af van de documenteigenschappen die de promovendus aan de dissertatie heeft meegegeven.
Alternatieven
De beschikbaarheid van een mogelijkheid om uitsluitend naar Nederlandse proefschriften te zoeken zal beslist een flink aantal bezoekers naar de DAREnet site lokken. (Door de week is de site inderdaad regelmatig onbereikbaar.) Anderzijds kun je je afvragen of er in potentie niet een veel groter publiek is dat via andere wegen bij dit materiaal zou kunnen komen. Daarbij valt onderscheid te maken tussen twee zaken.
In de eerste plaats is het – bepaalde onderwerpen daargelaten – niet zo waarschijnlijk dat potentiële belangstellenden in een bepaald onderwerp daarover uitgerekend een Nederlands proefschrift zouden willen raadplegen. Veel meer voor de hand ligt dat men geïnteresseerd is in een wetenschappelijke publicatie in het algemeen, en dat men om in die interesse te kunnen voorzien, liever een algemene, internationale wetenschappelijke zoekmachine zou willen gebruiken.1) En zelfs als iemand speciaal in elektronische dissertaties geïnteresseerd zou zijn, zou hij of zij dan ook bereid zijn de DARE's van alle Engels schrijvende landen te gebruiken om te vinden wat hij of zij zoekt? Ik noem als voorbeeld maar dissertaties in de vele takken van de geneeskunde, waar de lingua franca Engels is.
Daarbij komt dat de vindbaarheid van de dissertaties via de korte beschrijvingen die bij DARE onder bibliografische informatie te vinden zijn, niet in alle behoeften voorziet. Zoals gezegd, abstracts en trefwoorden ontbreken nogal eens, en de abstracts zijn vaak heel compact. Het is in elk geval denkbaar dat iemand een dissertatie zou willen vinden met een aantal zeer specifieke zoektermen die niet in de beschrijving van het proefschrift, maar in het proefschrift zelf voorkomen. Kan ook in die behoefte worden voorzien?
Voor beide hierboven genoemde manco's zijn alternatieven voor DARE beschikbaar. Te denken valt daarbij aan meer algemene full-text indexerende zoekmachines als Google, Yahoo!, MSN, Ask, Exalead, Google Scholar, Windows Live Academic, Scirus en niet te vergeten de Surfnet zoekmachine.
Alle, of in elk geval een groot deel van de, hedendaagse Nederlandse proefschriften hebben op de titelpagina de phrases “ter verkrijging van” (soms Engels: “to obtain”), “op gezag van” (“on the authority of”) en “in het openbaar te verdedigen” (“to be publicly defended”). Toevoeging van de term magnificus specificeert bij die phrases in het Engels dat het om Nederlandse proefschriften moet gaan. Laten we nu eens kijken welke van de hierboven genoemde zoekmachines Nederlandse proefschriften indexeren:
| Zoekmachine | Aantal | Waarvan PDF |
|---|---|---|
| | ||
| Yahoo! | ||
| MSN | ||
| Ask | ||
| Exalead | ||
| Google Scholar | ||
| Windows Live Academic | | |
| Scirus | ||
| Surfnet | 4601 | 4569 |
Dit staatje is alleen bedoeld om een globaal beeld te geven van de dekking van het materiaal door diverse zoekmachines. Ik heb me daarbij niet beperkt tot wat er in de repositories berust, hoewel het vanzelf spreekt dat het exemplaar van een dissertatie in een repository het enige is waarvan men absoluut zeker kan zijn dat het het officiële proefschrift is. Per slot van rekening kan een van de hierboven genoemde zoekmachines worden gebruikt om een (onofficiële versie van een) dissertatie te vinden, waarna de officiële versie altijd nog op titel via DARE kan worden opgespoord. Ook heb ik het relatief kleine aantal Nederlandse dissertaties met een titelpagina in het Engels buiten beschouwing gelaten.
Uit de tabel blijkt dat Google, Yahoo!, Google Scholar en de Surfnet zoekmachine qua aantallen geïndexeerde dissertaties het meest in aanmerking komen om als een full-text alternatief voor de door DARE aangeboden zoekmogelijkheden te dienen.
Beschrijving versus full-text
Hierboven heb ik twee redenen gegeven waarom zoekmachines zoals de genoemde als alternatief voor de DAREnet-toegang kunnen dienen: ze bereiken een veel groter publiek – dat misschien nooit met DARE als een van de vele toegangen tot wetenschappelijke literatuur op het Web in aanraking zal komen – en ze indexeren full-text, waardoor op een veel meer gedetailleerd niveau gezocht kan worden – mits de zoekmogelijkheden van de betreffende zoekmachines daarvoor geschikt zijn. Bij de vier hierboven genoemde zoekmachines is dat – al blijft er genoeg te wensen over – wel het geval. Problemen met full-text zoeken in dissertaties blijven er intussen genoeg: zo hebben veel zoekmachines nog altijd in meer of mindere mate problemen met het PDF-formaat van de geïndexeerde documenten, en bevatten veel proefschriften tekst in de vorm van formules etc. die vermoedelijk niet geïndexeerd kan worden en waarnaar in elk geval niet gezocht kan worden.
Zoeken in beschrijvingen en full-text zoeken zijn twee heel verschillende activiteiten, die om een verschillende benadering vragen. In beschrijvingen zijn allerlei zaken gestandaardiseerd en gestructureerd die dat in full-text documenten niet zijn, maar wat natuurlijk veel belangrijker is, is dat de zoekvraag in heel andere zoektermen moet worden vertaald. Dat kan twee kanten op zijn: het kan zijn dat een specifieke vraag naar zoektermen op een meer algemeen niveau moet worden overgebracht (zoek informatie over de Slag bij Nieuwpoort door een boek over de Tachtigjarige Oorlog te vinden) of andersom, een algemene vraag moet worden vertaald in een aantal specifieke zoektermen, die, als het gezochte document ze bevat, garanderen dat het het algemene onderwerp bestrijkt (zoek een boek over de Tachtigjarige Oorlog door een reeks zoektermen als “beleg van Alkmaar”, “Leidens ontzet” en “Slag bij Nieuwpoort”).
Full-text zoeken en zoeken via beschrijvingen complementeren elkaar dus eerder dan dat ze elkaars alternatieven zijn.
Dekking door zoekmachines per instelling
Laten we nu eens kijken naar de mate waarin de proefschriften aan de diverse universiteiten door de vier hierboven genoemde full-text zoekmachines gedekt worden.1)
| Zoekmachine | DARE | Google2) | Google Scholar2) | Yahoo!2) | Surfnet |
|---|---|---|---|---|---|
| Universiteit | | | | | |
| Amsterdam | 132 | ||||
| Amsterdam VU | 173 | ||||
| Delft | 10 | ||||
| Eindhoven | 740 | ||||
| Groningen | 2143 | ||||
| Leiden | 4+23) | ||||
| Maastricht | 40 | ||||
| Nijmegen | 3 | ||||
| Rotterdam | 4 | ||||
| Tilburg | 7 | ||||
| Twente | 121 | ||||
| Utrecht | 408 | ||||
| Wageningen | 487 | ||||
| Subtotaal | 12011 | 5521 | 1777 | 3744 | 4274 |
| Elders4) | | 855) | |||
| Totaal | 12011 | 6197 | 2038 | 4622 | 4359 |
1) De getallen voor de zoekmachines Google, Google Scholar en Yahoo! hebben betrekking op de hele sites, niet enkel op de repositories. Ze zijn geflatteerd omdat zo ook dissertaties van andere instellingen, waarvan een kopie op de eigen site is opgeslagen, zijn meegeteld. Ook onvolledige dissertaties (voorwerk, samenvattingen, afzonderlijke hoofdstukken) zijn in de getallen meegenomen.
2) Getallen boven de 1000 in de kolommen 3, 4 en 5 zijn schattingen van de betreffende zoekmachines.
3) De Surfnet zoekmachine laat je per instelling zoeken. De Universiteit Leiden is twee keer beschikbaar, als Rijksuniversiteit en als Universiteit. Bij de laatste keuze vind je twee dissertaties van het International Institute for the Study of Islam in the Modern World (ISIM), een in Leiden gevestigd instituut gesticht door vier Nederlandse universiteiten: die van Leiden, Amsterdam, Utrecht en Nijmegen. Een van deze dissertaties is niet via DARE te vinden, wat twijfel wekt aan de pretentie dat alle Nederlandse elektronische dissertaties via DARE vindbaar zouden zijn; de andere wordt door DARE bij de VU gesitueerd, wat merkwaardig lijkt gegeven het feit dat de VU niet een van de deelnemers in het ISIM is. De links bij DARE naar de dissertatie zelf en de bibliografische informatie lopen dood.
4) Behalve op de sites van de aan DARE deelnemende universiteiten blijken met de gebruikte zoektermen elders nog honderden Nederlandse dissertaties te kunnen worden gevonden. Bij nadere inspectie blijken die meestal alleen inhoudsopgaven of summaries te zijn. Complete dissertaties vind je wel, maar die zijn dan vaak ook weer in de repositories van de universiteiten te vinden. Niettemin vinden we op deze manier ook complete Nederlandse digitale dissertaties die momenteel niet via DARE te vinden zijn. Twee voorbeelden zijn dissertaties op de sites van de Landelijke Onderzoekschool Taalwetenschap in Utrecht – die dissertaties van diverse universiteiten publiceert -- en het Amsterdamse National Institute for Nuclear Physics and High Energy Physics. Twee voorbeelden van niet via DARE gevonden proefschriften zijn dit en dit. Dissertaties die niet via DARE te vinden kunnen ook op sites in het buitenland gepubliceerd zijn.
5) Zijnde het verschil tussen het totale aantal dissertaties, gevonden met de drie phrases “ter verkrijging van”, “op gezag van” en “in het openbaar te verdedigen”, en het subtotaal van de dissertaties, gevonden bij de diverse instellingen.
Uit de hierboven getoonde tabel vallen drie conclusies te trekken:
Sommige universiteiten, zoals Delft, Eindhoven, Groningen en Utrecht, zijn veel verder met het beschikbaar stellen van digitale proefschriften dan andere, zoals Tilburg, Amsterdam VU, Leiden en Amsterdam.
Tilburg, Rotterdam, Nijmegen, Leiden en Maastricht scoren slecht bij het full-text vindbaar maken van hun dissertaties via de algemene of wetenschappelijke zoekmachines.
DARE geeft geen toegang tot alle Nederlandse dissertaties die in digitale vorm op het Web beschikbaar zijn.
Een testje
Hierboven hebben we gezien dat vier zoekmachines toegang verschaffen tot de full text van een aanzienlijk aantal Nederlandse dissertaties; Google meldt er zelfs meer te vinden dan waartoe de zoekmachine van DARE toegang geeft, maar dat is schijn. Op het eerste gezicht maken de resultaten van Google al duidelijk dat deze zoekmachine naast complete proefschriften ook incomplete exemplaren vindt.
Ik was nieuwsgierig voor hoeveel dissertaties die ik via DARE vond, het complement van full-text doorzoeken via Google, Yahoo!, Google Scholar en de Surfnet zoekmachine daadwerkelijk aanwezig was, en heb daarvoor een kleine steekproef uitgevoerd met 39 willekeurige proefschriften die ik via DARE vond: drie voor elk van de dertien universiteiten die zijn opgenomen. Ook bij dit testje heb ik de zoekacties niet tot de repositories beperkt, maar in plaats daarvan bij de dissertatie die ik vond genoteerd waar ik ze vond. Om de dissertaties te vinden heb ik twee phrases gebruikt waarvan ik eerst heb geconstateerd dat ze die bevatten: één phrase op of omstreeks blz. 40 van het document en één tegen het eind om te controleren of de hele dissertatie geïndexeerd was. Die phrases staan steeds in één regel in de dissertatie, omdat mij al doende bleek dat phrases die verdeeld zijn over twee of meer regels, als gevolg daarvan door sommige zoekmachines niet gevonden worden.
| Repository | Proefschrift | Zoekvraag | | Yahoo | Scholar | Surfnet |
|---|---|---|---|---|---|---|
| DIS1 Vraag 1 | "appear in the expressions of the renormalized" | nee 1) | ja | |||
| | Vraag 2 | "associated with the theory of electron-electron" | ja | |||
| | DIS2 Vraag 1 | "discuss the range of uses that are connected" | ja | |||
| | Vraag 2 | "we view the action presented" | ja | |||
| | DIS3 Vraag 1 | "connection that some thought Raphael physically" | nee | |||
| | Vraag 2 | "use of abstract nouns as mythological personages" | nee | |||
| DIS1 Vraag 1 | "the behaviour of the Kähler potential" | ja 2) | nee | |||
| | Vraag 2 | "the various supersymmetry variations" | ja 2) | nee | ||
| | DIS2 Vraag 1 | "repeated a special case of the clauses" | ja | |||
| | Vraag 2 | "height of a formula occurrence in a derivation D means" | nee 3) | ja | ||
| | DIS3 Vraag 1 | "also more than just a vague semantic connection between" | ja | |||
| | Vraag 2 | "own further research may cause us to modify some" | ja | |||
| DIS1 Vraag 1 | "to remember many syntax rules" | nee | ||||
| | Vraag 2 | "notify the query results to maintain" | nee | |||
| | DIS2 Vraag 1 | "his mind during the process of framing" | nee | |||
| | Vraag 2 | "tools that help removing the barriers" | nee | |||
| | DIS3 Vraag 1 | "facilities used for validation are described below" | nee | |||
| | Vraag 2 | "function extracts from general weather matrices" | nee | |||
| DIS1 Vraag 1 | "describe arbitrary orderings of events" | nee | ||||
| | Vraag 2 | “direction are similar and therefore omitted” | nee | |||
| | DIS2 Vraag 1 | “significantly differentiate syntactic choices” | nee | |||
| | Vraag 2 | “western style materialism will remain” | nee | |||
| | DIS3 Vraag 1 | "bisimilarity is proved to be a congruence" | ja | |||
| | Vraag 2 | "proof is omitted for this trivial property" | ja | |||
| DIS1 Vraag 1 | "countability class directly leads" | ja | ||||
| | Vraag 2 | "languages with respect to the surface indicators" | ja | |||
| | DIS2 Vraag 1 | "implications usually consist of “commonplaces” about" | ja | |||
| | Vraag 2 | "Tolstoi is his avoidance of human" | ja | |||
| | DIS3 Vraag 1 | "mogelijkheid God aan te spreken in de tweede" | ja | |||
| | Vraag 2 | "kort fragment uit ons tekstgedeelte voorgelezen" | ja | |||
| DIS1 Vraag 1 | "and holds for similar verbs such as to push or to drive" | ja 5) | ja | |||
| | Vraag 2 | "this dissertation that I consider most intriguing" | ja 5) | ja | ||
| | DIS2 Vraag 1 | "Wu suggests that the a attached to declarative sentences" | ja 5) | ja 6) | nee | |
| | Vraag 2 | "Previously we saw that the same constraint held in Mandarin and Cantonese" | ja 5) | nee | ||
| | DIS3 Vraag1 | "poles upon approaching the critical point from the disordered side" | nee | |||
| | Vraag 2 | “freedom such as compression and shear” | nee | |||
| DIS1 Vraag 1 | "hypothesis that people who experienced a lot of childhood" | ja | ||||
| | Vraag 2 | “bijeenkomsten heb ik het heel bijzonder" | ja | |||
| | DIS2 Vraag 1 | "studies it was shown that parental rearing" | nee | |||
| | Vraag 2 | "strongly associated with perceived parental" | nee | |||
| | DIS3 Vraag 1 | "parents of the children recorded times in a log" | ja | |||
| | Vraag 2 | "meningen en luisterende oren heb ik altijd" | ja | |||
| DIS1 Vraag 1 | "declarative sentences with the logical subject" | ja 5) | ja 7) | nee | ||
| | Vraag 2 | "environmental technology, history, lathe operator" |
