HomeNieuws'Taaltechnologie helpt wetenschap met beter zoeken en meer vinden'

'Taaltechnologie helpt wetenschap met beter zoeken en meer vinden'

Taaltechnoloog werkt aan zoeksysteem voor dreigtweets.

Antal van den Bosch, hoogleraar Example-based language modelling aan de Radboud Universiteit Nijmegen, ontwikkelt taaltechnologie zoals vertaalprogramma’s, spellingscorrectoren en zoekmachines. Systemen die zo slim zijn, dat ze nieuwe inzichten opleveren voor de taalwetenschap en andere wetenschapsgebieden. Vrijdag 9 november jl. sprak Van den Bosch zijn oratie uit, getiteld 'Taal in uitvoering'.

Een voorbeeld: wat zijn de betekenisdragende eenheden van taal? Theoretische taalwetenschappers zoeken het antwoord in een systeem dat uitgaat van woorden en een grammaticaal regelsysteem. Maar een vertaalprogramma dat leert uit vertalingen en verder geen taalkundige kennis krijgt aangereikt, ontdekt dat taal ook uit andere elementen is opgebouwd.

“Als je onder de motorkap van zo’n programma kijkt, vallen veelvoorkomende woordcombinaties op die samen een specifieke betekenis hebben. Zoals een eigen huis, waarmee een koophuis bedoeld wordt. Dat staat er niet, maar dat betekent het wel. Die betekenis is niet af te leiden uit losse woorden of grammaticale regels. Taaltechnologie toont hier aan dat de betekenis van taal voor een belangrijk deel in woordgroepen zit verpakt.”

Taaltechnologie krijgt wel eens het verwijt een extreem datagedreven wetenschapsgebied te zijn: je hebt een databerg, daar laat je wat zoekvragen op los en allicht komt er dan een antwoord uit. Bovenstaand voorbeeld is er één dat duidelijk maakt hoe Van den Bosch naar de tegenstelling tussen theoretici en datagedreven onderzoekers kijkt. Hij vindt die “wezenlijker voor de wetenschap dan die tussen alfa’s en bèta’s. En vruchtbaarder: want de ene onderzoeker die wil bewijzen dat zijn theorie klopt en de andere die onbevooroordeeld naar de data wil kijken, dagen elkaar uit en stimuleren elkaar.”

De laatste jaren werkt Van den Bosch aan slimme zoeksystemen waar niet alleen taalkundigen wat aan hebben. “Veel wetenschap, zeker geesteswetenschap, draait om tekst. Veel tekst. Onderzoekers zitten met de vraag: hoe doorzoek je die snel en goed?”

Samen met collega’s Bedrijfscommunicatie onderzoekt Van den Bosch de komende jaren welke gezondheidsbevorderende communicatie goed, beter of juist helemaal niet overkomt en overgenomen wordt. Met het Internationaal Instituut voor Sociale Geschiedenis (IISG) werkt hij aan een zoekfilter waarmee historici die onderzoek doen naar stakingen, ook arbeidsconflicten kunnen opsporen die net niet tot staking hebben geleid.

Daarnaast werken Van den Bosch en collega’s op dit moment met het ANP aan een zoeksysteem dat twitterberichten kan doorzoeken op signalen die voorspellen wat nieuws kan worden. En met het Korps Landelijke Politiediensten (KLPD) wordt een zoeksysteem naar dreigtweets ontwikkeld.


Reacties

Er is nog niet gereageerd op dit artikel.
Login om te reageren op dit artikel. Klik hier
  Where To Buy Viagra OnlineLow Price CialisViagra No RxBuy Viagra For WomenHow You Get Pfizer Viagra