08 oktober 2015Sluit venster
CLARIAH digitaliseert gegevensreeksen van verschillende bronnen om nieuwe wetenschap te puren uit deze informatie
Amsterdam - We interviewden Jose van Dijck, Voorzitter van de Koninklijke Nederlandse Akademie van Wetenschappen (KNAW) en Professor Media Studies aan de Universiteit van Amsterdam tijdens het 3e eScience Symposium in de ArenA. Jose van Dijck wordt erg geboeid door de digitale geesteswetenschappen als een nieuwe tak binnen de geesteswetenschappen die zich concentreert op digitale bronnen. Haar team werkt met digitale tekst maar ook met digitale beeld en geluid. Men werkt met gestructureerde gegevens en onderzoekt hoe deze digitale gegevens zich omvormen tot nieuw materiaal waaruit nieuwe interpretaties kunnen gehaald worden. Al deze gegevens plaatsen de onderzoekers voor heel wat nieuwe uitdagingen. Verleden jaar kreeg het team een grote subsidie van 12 miljoen euro van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) om een infrastructuur op te zetten voor alle geesteswetenschappen. Daarmee kunnen instrumenten ontwikkeld worden voor een beter begrip en interpretatie van digitale bestanden. Het team haalt de gegevens uit tekstarchieven.

Jose van Dijck werkt met audio-visuele gegevens die gedigitaliseerd werden in de laatste 5 tot 10 jaar. Momenteel is haar team bezig met het uitzoeken hoe deze digitale bestanden gemijnd kunnen worden, met name door digitale instrumenten. Het project heet CLARIAH en heeft heel wat onderzoekers. Minstens 4 Nederlandse universiteiten zijn erbij betrokken.

Jose van Dijck bouwt een coalitie uit voor digitale geesteswetenschappen in Nederland waar tenminste 7 of 8 universiteiten bij betrokken worden, alsmede 5 nationale instituten. Al deze onderzoekers werken met gedigitaliseerde gegevensbestanden die kunnen helpen om beter uit te voeren waar men al mee bezig was.

Van bij het begin tracht men heel nauw samen te werken met onderzoekers uit de geesteswetenschappen, zoals historici, studenten in de media, taalkundigen, maar anderzijds ook met computerwetenschappers om samen vragen te formuleren zodat het onderzoek kan gebeuren in onderlinge samenwerking, veeleer dan dat computerwetenschappers beschouwd worden als de assistenten van de geesteswetenschappers.

Jose van Dijck hoopt dat de mensen uit de geesteswetenschappen beter beslagen worden in het interpreteren en coderen van computertalen en de basisbeginselen van programmeren zodat ze ontdekken dat de digitale taal ook een taal is die bestaat uit codes en algoritmes. Anderzijds kunnen computerwetenschappers meer interesse krijgen in hermeneutica, interpretatie van gegevens dan enkel maar bezig zijn met algoritmes. Het is de bedoeling dat beide onderzoeksgroepen van elkaar leren.

Er wordt gewerkt met verschillende types van gegevens. Zo zijn er bijvoorbeeld de gestructureerde gegevens die uit de archieven komen, zoals uitgebreide demografische gegevens die uit de gemeentelijke archieven afkomstig zijn - van de 17de of de 18e eeuw. Aan de andere kant zijn er de audio-visuele bronnen. Er bestaat een groot archief in Nederland - Beeld en Geluid. Het Instituut voor Beeld en Geluid digitaliseert alle televisie- en radioprogramma's. Via ondertiteling krijgt men toegang tot deze teksten, via het gesproken woord dat gebruikt werd in bepaalde programma's

Er zijn ook taalkundige gegevens. Als men een tekst overschrijft die men op televisie hoort, bijvoorbeeld, dan heb je ook tekstgegevens die kunnen gemijnd worden door taalkundigen. De grote uitdaging bij deze variatie aan gegevens is om deze samen te brengen en instrumenten te ontwikkelen vanuit deze verschillende gegevensreeksen die kunnen helpen bij het combineren van die verschillende gegevensreeksen.

De onderzoekers trachten de grote vragen te stellen waarop nog geen antwoord bestaat. Hoe komt het bijvoorbeeld dat bepaalde stereotypen van minderheden blijven terugkomen in beelden in de media? Dit is reeds 50 jaar het geval. Men wil onderzoek doen over hoe deze beelden zich ontwikkelen. Nu spreken we over migranten maar op een bepaald punt in de tijd hadden we het over tijdelijke werkkrachten. We hebben een aantal verschillende termen voor migranten die naar dit land zijn uitgeweken. Het is zeer boeiend om deze gegevensreeksen te combinveren vanuit een veelheid aan bronnen, zoals tekstuele gegevens, audio-visuele gegevens, en archieven bijvoorbeeld, om werkelijk bewijs te hebben van hoe deze migratiegroepen verschillende culturele transformaties ondergingen. Dat gaat men onderzoeken.

Er is een sterke groep in Nederland binnen alle verschillende disciplines maar ook in Europa bestaat een sterke interesse voor de digitale geesteswetenschappen. Er bestaan sterke groepen in Ierland maar ook in Siberie, bijvoorbeeld. Een van de collega's van Jose van Dijck bezocht Siberie waar een erg actieve groep van digitale geesteswetenschappers bestaat. Die is er ook in het Verenigd Koninkrijk, in Duitsland en in Frankrijk. Voortdurend worden samenwerkingsverbanden opgezet binnen Europa, en natuurlijk ook in de Verenigde Staten. Het team van Jose van Dijck werkt ook samen met Amerikaanse collega's.

Meer informatie is beschikbaar op de CLARIAH project website.
http://primeurmagazine.com/weekly/AE-PR-12-15-14.html
Sluit venster