HomeBijdragenDe mythe van de catalogus

De mythe van de catalogus

Avatar

Waardering:

  • 1 sterren
  • 2 ster
  • 3 ster
  • 4 ster
  • 5 ster

Eric Sieverts

Eric Sieverts is werkzaam op de Hogeschool van Amsterdam en bij de Universiteitsbibliotheek Utrecht. Hij is redacteur van InformatieProfessional.

[Zie hier ook "De mythe van Google"]

Veel bibliotheken beschouwen hun catalogus nog altijd als paradepaardje van hun organisatie. Overigens wel een paradepaardje waar veel aandacht, inspanning en geld heen gaat. Daarom even een gewetensvraag: wat heeft een gebruiker aan een catalogus? En dan heb ik het vooral over de catalogus voor het vinden van fysiek materiaal.

foto: Deborah Fitchett1. Als een gebruiker al weet naar welk boek hij op zoek is, kan het een handig hulpmiddel zijn, mits de naam van de auteur en/of de titel van het boek vrij exact en correct waren onthouden. Dat is dus voor de "Known item" search.
In die situatie kan ook het hebben van een gemeenschappelijke catalogus handig zijn, landelijk of misschien zelfs wereldwijd zoals Worldcat. Dat voor het geval een gewenst boek niet in de eigen lokale bibliotheek aanwezig is. Maar dan moet er wel een optie zijn, om eenvoudig te zien wat de dichtstbijzijnde lokatie is waar het wel aanwezig is (zoals in Worldcat) en of er een leveringsmogelijkheid bestaat (al wordt die laatste dienst wel erg duur - of is die zelfs niet beschikbaar - als het over de landsgrenzen heen gaat).

2. Als een gebruiker ter ontspanning "zo maar een boek" zoekt, is een klassieke catalogus eigenlijk nauwelijks van nut. Dan heeft iemand er meer aan om zo maar wat langs de planken te lopen en daar af en toe een boekje af te pikken, zoals ik dat in een boekwinkel in een dergelijke situatie ook doe. Maar daarvoor moet er wel een open opstelling zijn, die op zijn minst op genre of onderwerp is ingedeeld.
Een computersysteem heeft dan alleen enige zin als het met Amazon-achtige suggesties komt bij titels die je al eerder hebt geleend of zojuist hebt opgezocht. En juist ook dan zal er meer informatie (metadata) beschikbaar moeten zijn dan alleen een titel, drie trefwoorden en/of een SISO-code. Anders heeft de klant nog geen idee wat voor soort boek hem wordt aangeraden. Wat dat betreft hebben openbare bibliotheken op dit moment nog een betere uitgangssituatie dan universiteitsbibliotheken. Bij OB's kunnen de AI's (de aanschafinformatieteksten) in elk geval voor de gebruiker beschikbaar zijn. Bij UB's begint dergelijke extra informatie pas langzamerhand via links naar externe bronnen (zoals Syndetics) beschikbaar te komen.

3. Bij onderwerpsvragen is de situatie ronduit rampzalig als je het van een catalogus moet hebben. Wie een boek over een algemeen onderwerp als "economie", "fysiologie" of "meteorologie" wil hebben, vindt nog wel wat. Maar wie op zoek is naar iets heel specifieks, wat vast in bepaalde boeken wordt behandeld, maar alleen in een specifiek hoofdstuk en niet als onderwerp van het hele boek, blijft met lege handen staan.
Laten we als voorbeeld eens een leerboek nemen: "Introduction to Information Retrieval", een boek van 480 bladzijden (dat overigens ook in zijn geheel - en af en toe ge-update - gratis op internet beschikbaar is).
Het boek telt 21 hoofdstukken, elk met een titel die vrij expliciet aangeeft welke deelonderwerpen en technieken daarin worden besproken. Elk hoofdstuk is nog verder onderverdeeld in paragrafen, waarvan het boek er in totaal 117 telt. Elke paragraaf ook weer met een vrij expliciete titel.
Ook telt het boek een onderwerpsindex: 14 dichtbedrukte pagina's met de lijst van alle onderwerpen die in het boek aan de orde komen.
In de catalogus is dit boek, behalve met de vrij algemene titel, beschreven met  ÉÉN  NBC code (06.64: Information Storage en Retrieval) en met  ÉÉN  GOO trefwoord dat bovendien, met uitzondering van het woordje "en" dat in "and" is vertaald, identiek is aan de NBC omschrijving.
(Overigens had de vaak bejubelde mogelijkheid van User Generated Content de situatie voor dit voorbeeld ook niet veel verbeterd, de woordenwolk van user-tags in Librarything bood maar weinig meer zinvolle ingangen dan de gewone kale catalogus).
Wie specifiek iets wil lezen over één van de talloze (deel)onderwerpen die in het boek aan de orde komen, kan waarschijnlijk wel bedenken dat daar in een boek over "Information Storage en Retrieval" wel iets over te vinden zou kunnen zijn. Maar aan dit soort summiere metadatarecords kun je ook absoluut niet zien in welk van die vele algemene boeken op dit terrein dat wel of niet het geval zal zijn. Daarvoor moet je elk van die boeken eerst van de plank halen (of uit een gesloten magazijn laten ophalen) om het door te bladeren op zoek naar het gewenste onderwerp.
Je hoeft maar eens gebruik te maken van Google Books, dat zelfs full-text in de geOCRde inhoud van hele boeken zoekt, om te merken hoe plezierig het is op zulk detailniveau te kunnen zien wat er in een boek aan de orde komt.
OK, zoeken in Google Books zal zeker ook precisieproblemen met zich mee brengen. Een boek waarin alleen op bladzijde 318 het woord "vectormodel" voorkomt, zal aanzienlijk minder relevant zijn, dan het eerder genoemde "Introduction to Information Retrieval", waarin hele paragrafen aan dat onderwerp gewijd zijn. Maar daar doen relevance ranking technieken wel iets aan.
Ook hier zijn OB's, met hun hopelijk doorzoekbare AI's, dus nog weer wat in het voordeel ten opzichte van UB's. Want ook al wordt daar gebruik gemaakt van extra boekinformatie van bijvoorbeeld Syndetics, dan is die in de catalogus helaas nog niet doorzoekbaar.

Tussen de kale metadatarecords van onze huidige catalogi en het andere uiterste van full-text zoeken in volledige boekinhouden, kan ik me dus heel goed een tussenvorm voorstellen, waarin op zijn minst samenvattingen, inhoudsopgaven, onderwerpsindexen en omslagteksten van boeken mee doorzocht worden. Zolang we dat nog niet kunnen bieden, is het een mythe dat we onze gebruikers met catalogi een nuttig hulpmiddel bieden om de boeken te kunnen vinden waarin ze geïnteresseerd zijn. Daardoor jagen we onze gebruikers toch weer naar Google, dat op elke vraag instant satisfaction geeft.


Reacties

  • Maar Worldcat Local is toch de ultieme oplossing voor het dilemma tussen Worldcat en lokale OPC? Ik heb laatst een versie bekeken van een bibliotheek in Washington. Geweldig. Dus waarom nog lang zoeken? Ben overigens zeer benieuwd naar Eric's volgende blog "De mythe van Google", want ik blog hier intern al een tijdje over Jeff Jarvis' "What should Google do?" en heb dit boek onlangs zelfs tot nieuwe bijbel bevorderd.

    @ 30-06-2009 16:18
  • Klanten willen drie zaken:
    1. (Links naar) fulltext.
    Onderzoekers en studenten hebben niet genoeg aan titels van papieren boeken in catalogi. Dus: zorg voor links naar fulltext, beschrijvingen van tijdschriftartikelen en van digitaal beschikbare informatie.
    2. Goede metadata.
    Correcte omschrijving van de inhoud wordt steeds belangrijker om de juiste informatie beter te kunnen vinden. Daarmee krijgt het ouderwetse bibliotheekhandwerk meer betekenis: goede trefwoorden, een op maat gemaakte thesaurus en heldere abstracts wijzen de gebruiker de juiste weg.
    3. Snelheid van "leverantie".
    Digitaal: medewerkers van wetenschappelijke bibliotheken hebben ook de taak om te zorgen dat de wetenschappelijke "productie" van hun eigen organisatie in een repository breed beschikbaar is (en dan via zoekmachines en www.scientificcommons.org makkelijk te vinden en te lezen is.
    Concreet in handen: via www.worldcat.org is ook te vinden of een boek binnen x kilometer van je postcode te vinden is. Zorg dat je bibliotheekcatalogus in Worldcat komt.
    PS Over de "instant satisfaction" van Google: Ja, die snelle bevrediging is handig, maar er komt meer gemor en gemopper. Over de sponsored links bij Google (en dus de betrouwbaarheid van het algoritme), over de schending van het auteursrecht in Google Books, over de kwaliteit (zie Google Books Mutilates the Printed Past, http://chronicle.com/free/v55/i39/39b00401.htm). Er zijn alternatieven, zie bijv. The Internet Archive http://www.archive.org
    Jos Damen, Afrika-Studiecentrum, Leiden, www.ascleiden.nl

    J.C.M Damen @ 30-06-2009 13:21
  • Dat de catalogus van het eigen bezit van de bibliotheek een handig hulpmiddel is om materialen te lokaliseren staat als een paal boven water. Toen we onze gebruikers niet veel meer konden bieden dan de lokale catalogus, was het ook van belang om aanvullende metadata aan die lokale catalogus toe te voegen om op die manier de search and discovery ervaring van de gebruiker te verrijken. Maar op dit moment is dit een beetje achterhaald: zeker voor de wetenschappelijke bibliotheken.
    Want is het lokaliseren van een boek niet de laatste stap in het zoekproces? Dienen wetenschappers en studenten niet hun zoekactie te starten in een veel bredere context, zoals Google Scholar, -Books, WorldCat, OAISTER, OpenDOAR, PiCarta: kortom de een zo breed mogelijk aanbod?
    In plaats van onze inspanningen te richten op het verrijken van de lokale metadata zouden we nu eindelijk de handen eens ineen moeten slaan en de wereldwijde metadata zo rijk mogelijk maken.
    Zodra de student nu zijn onderwerp zoekactie heeft teruggebracht tot enkele titels en uiteindelijk weet welke titel h/zij wil hebben, komt de vraag aan de orde van "the most appropriate copy". Dat kan per situatie verschillen: ben je je aan het orienteren dan kun je best wachten tot het uitgeleende exemplaar terugkomt of via IBL beschikbaar is. Heb je meer haast dan ben je wellicht bereid de titel bij een online bookshop --al dan niet tweede hands-- aan te schaffen.
    Dus mijn pleidooi: laten we iedere titel één keer zeer uitgebreid beschrijven en laten we daar vervolgens de hele wereld van laten genieten.
    Overigens: toen ik net op de link naar Librarything (http://www.librarything.com/work/4280462) klikte waren er veel meer tags toegevoegd en was de titel dus op veel meer manieren vindbaar.
    NB: de link naar Worldcat hierboven werkt niet.
    Ook de moeite waard over dit onderwerp is de discussie op de blog van Gerard Bierens (http://www.gerardbierens.nl/index.php/blog/reacties/de-fysieke-bibliotheekcollectie-versus-digitale-content-samen-of-apart/).

    Michel Wesseling @ 29-06-2009 18:50
  • Een dure maar goede oplossing is TOC en samenvattingen aankopen en laden (TUD doet dat dacht op basis van Blackwell/Syndetics data). Verder is het heel raar dat uitgevers deze informatie niet digitaal leveren bij aankoop van een boek. Heel mooi zou zijn als je zoeken in Google Books zou kunnen beperken tot boeken die full view heben (kan nu al) aangevuld met alle boeken die in een bibliotheek naar keuze (of binnen x kilometer van mijn postcode) beschikbaar zijn (kan nog niet). Want laten we eerlijk zijn: nieuwe wetenschappelijke boeken zullen over een aantal jaren toch vooral als e-book gekocht worden en de reeds bestaande collecties zullen niet snel op grotere schaal grondiger ontsloten worden dan Google nu doet. Als de nieuwe ebooks en de bestaande collecties via Google ontsloten worden kunnen we daar straks niet veel meer aan toe te voegen. Dan gaan we alleen nog maar collectioneren op basis van de eerste 30 treffers in Google Books bij bepaalde onderwerpen, want bibliotheekgebruikers zullen de rest toch niet bekijken.....

    jeroen bosman @ 29-06-2009 14:27
Login om te reageren op dit artikel. Klik hier