SODHA – Social Sciences and Digital Humanities Archives: een archief voor wetenschappelijke gegevens in sociale en digitale humanewetenschappen
Benjamin Peuch, Rijksarchief
Oliver Lenaerts, Rijksarchief
Johan Van der Eycken, Rijksarchief
Rolande Depoortere, Rijksarchief
Youssef Ouahalou, Rijksarchief
Na de sluiting van de Belgian Archives for Social Sciences (BASS) aan de Université catholique de Louvain (UCLouvain) in 1998, beschikte België gedurende 20 jaar niet meer over een data-archief voor sociale wetenschappen. Data-archieven zijn gespecialiseerde depots of opslagplaatsen bestemd voor de bewaring en de valorisatie van waardevolle datasets. Ze bestaan niet enkel in de positieve wetenschappen, zoals men zou kunnen verwachten: het eerste data-archief voor sociale wetenschappen, het Roper Center, werd opgericht in 1946 in het Williams College in Massachusetts.1 In Europa leidden verschillende initiatieven om onderzoeksdata van en voor de sociale wetenschappen te bewaren en voor hergebruik beschikbaar te maken, in 1976 tot de oprichting van het Consortium of European Social Science Data Archives (CESSDA). België was trouwens stichtend lid2 en tot 1998 verzamelde het BASS bijna 2.000 computerbestanden van onderzoeksgegevens met bijhorende documentatie.3
Onderzoeksgegevens zijn om verschillende redenen waardevolle ‘objecten’. In de eerste plaats zijn het, vanuit het standpunt van de archivaris, zeer gespecialiseerde gegevensbestanden die niet alleen essentieel zijn voor de geschiedenis van de wetenschap, maar die ook aangeven welke ideeën en belangen overheden op een bepaald moment de moeite waard achten om te bestuderen. Ten tweede zijn ze absoluut noodzakelijk voor de repliceerbaarheid van onderzoek, een essentieel onderdeel van de wetenschappelijke methode voor controle van de betrouwbaarheid. In dit kader kan verwezen worden naar de ‘replicatiecrisis’ tijdens het begin van de jaren 2010. Op dat ogenblik kwam aan het licht dat het repliceren van analyses en experimenten in de verschillende disciplines van de sociale wetenschappen vaak tot andere resultaten leidde.4 Sociale wetenschappers worstelen nog steeds met de vele implicaties van dit complexe probleem. Een minimale vereiste blijft echter de zorgvuldige bewaring van onderzoeksgegevens wat toekomstige onderzoekers toelaat oude hypothesen te testen en nieuwe onderzoeksvragen toe te passen. Deze zorg houdt verband met de bewijskracht van archieven. Archivarissen en documentbeheerders zijn zich bewust van dit probleem en het verzekeren van de authenticiteit van informatie behoort tot hun kernopdracht.
Na een onderbreking van meer dan 20 jaar beschikt België opnieuw over een data-archief voor sociale wetenschappen: het Social Sciences and Digital Humanities Archive (SODHA). Dit platform – te bereiken via het adres – werd in november 2020 door het Rijksarchief van België in samenwerking met BELSPO gelanceerd. Zoals de naam al aangeeft, richt SODHA zich op alle disciplines die deel uitmaken van het domein van de ‘digitale’ humane wetenschappen.
Een project van lange adem
Reeds in 2008 werd de nood om over een nieuw data-archief voor de sociale wetenschappen in België te kunnen beschikken benadrukt door een multidisciplinair team. Dit team onderzocht de problematiek gedurende een jaar met als resultaat een uitgebreid rapport.5 De blauwdrukken voor het opzetten van een nieuwe infrastructuur werden geschetst, maar concrete maatregelen bleven uit. De problematiek werd in 2015 opnieuw aangewakkerd toen onderzoekers van Interface Demography (Vrije Universiteit Brussel) en Centre de recherche en démographie (UCLouvain) de handen in elkaar sloegen en de studie actualiseerden. In 2017 werd het Rijksarchief bij het project betrokken omwille van zijn expertise inzake de valorisatie en opslag van gegevens. Een jaar later nam deze instelling de coördinatie van het project op zich, waardoor het in een stroomversnelling kwam, wat leidde tot de lancering van het SODHA-platform.
Hoewel de infrastructuur nog steeds projectmatig wordt gefinancierd, beantwoordt ze aan de initiële doelstellingen en is ze ook operationeel. SODHA verenigt de kennis en netwerken van onderzoekers uit de sociale- en humane wetenschappen samen met deze van de archiefsector. Digitale archivarissen zorgen immers voor het optimale beheer en de bewaring op lange termijn van deze gegevens om deze te vrijwaren voor de toekomst.
Internationale zichtbaarheid
Een andere uitdaging van het project was de internationale dimensie ervan. Op het ogenblik dat België opnieuw lid werd van CESSDA, diende het zich te conformeren aan de verplichten die worden opgelegd door deze infrastructuur. Dit betreft onder andere de oprichting van een data-archief en een nationale service provider. Deze laatste – voor België is dit SODHA – fungeert als Belgische vertegenwoordiger binnen (en buiten) het consortium.6 In dit opzicht was de deelname aan het projectteam van het Rijksarchief als federale wetenschappelijke essentieel. Dit liet immers toe rekening te houden met de Belgische staatstructuur, waarbij de bevoegdheid over wetenschapsbeleid, zich zowel op het niveau van de gemeenschappen als de federale overheid bevindt. De federale overheid is ook belast met de contacten tussen het Internationale en Europese niveau enerzijds en de Belgische entiteiten anderzijds. Als instelling is het Rijksarchief bovendien goed vertrouwd met internationale samenwerking door haar betrokkenheid bij verschillende grootschalige projecten. Het Rijksarchief is bijvoorbeeld stichtend lid van de Archives Portal Europe Foundation (APE). Deze stichting biedt een portaal aan voor de online publicatie van archiefcollecties van de Europese archieven.
Ook de CESSDA-dienstverleners zijn zich bewust van het belang van internationale samenwerking. Zo hebben ze de handen in elkaar geslagen om, onder meer, een online platform te creëren dat het mogelijk maakt de collecties van alle gegevensarchieven binnen het consortium mondiaal te presenteren via één gebruiksvriendelijk platform: de CESSDA Data Catalogue. Ook de SODHA-metadata worden automatisch via een OAI-protocol verzameld en via deze website gevaloriseerd. De toegevoegde waarde van een interdisciplinair platform zoals het onze is dat datasets uit andere humane wetenschappen zoals de linguïstiek of die werden opgesteld in het kader van historische projecten en die ook relevant zijn voor de sociale wetenschappen ook naar dit portaal kunnen worden geëxporteerd. Dit verhoogt niet enkel de online zichtbaarheid van deze data maar ook ook domeinoverschrijdend onderzoek wordt sterk aangemoedigd.
Veel operationele en juridische uitdagingen
Veel online archiveringsplatformen ontstaan vaak of worden beheerd in samenwerking met nationale archieven. Dit geldt ook voor SODHA. De wet- en regelgeving die van toepassing is op het verzamelen, beheren en ter beschikking stellen van archieven is vaak ook gedeeltelijk van toepassing op deze platformen. In België heeft het Rijksarchief de wettelijke opdracht belangrijke overheidsinformatie voor het nageslacht te bewaren. Dit is een zeer uitgebreide opdracht en omvat onder meer het vernietigen, het verwerven, het bewaren en het raadpleegbaar maken van archieven, evenals het verrichten van wetenschappelijk onderzoek op de uitgebreide collecties die de instelling beheert. Daarnaast oefent het Rijksarchief ook toezicht uit op federale archiefvormers en verleent ze advies over de correcte selectie en bewaring van documenten en data. SODHA is echter een vreemde eend in de spreekwoordelijke bijt. De onderzoekdata die worden verzameld en ter beschikking gesteld, zijn geen archieven in de zin van de Archiefwet waarvoor een wettelijke plicht tot archivering geldt. Het gaat over onderzoeksgegevens meestal van minder dan 30 jaar oud die bovendien niet in eigendom toebehoren aan een openbare instelling. De onderzoeksgegevens zijn eigendom van individuele onderzoekers en zijn als dusdanig geen ‘archiefdocumenten […] bewaard door openbare instellingen die aan het toezicht van de [overheid] onderworpen zijn’ in de zin van artikel 1 van de archiefwet. Het gevolg van die vaststelling is dat de juridische contouren anders liggen dan voor de traditionele archieven. 7
Alhoewel online archiveringsdiensten het fundamentele recht promoten van toegang tot informatie, brengen dergelijke platformen verscheidene juridische problemen met zich mee. Het hergebruik van overheidsinformatie is onderworpen aan specifieke regelgeving. De open data wetgeving heeft als doel zoveel mogelijk data toegankelijk te maken. Het snijpunt tussen open data wetgeving en andere reguleringen kan samengevat worden in de boutade as open as possible, as closed as necessary. Het platform heeft de maatregelen genomen om zich te conformeren aan de privacywetgeving en het auteursrecht. Wie spreekt over ‘open toegang’, kan niet omheen de privacy gerelateerd issues. Onderzoeksrapporten uit verschillende wetenschapstakken bevatten vaak persoonsgegevens door het gebruik van steekproeven, survey’s, interviews, enz. Het spreekt voor zich dat het verzamelen en ter beschikking stellen van deze gegevens impliceert dat er volgens privacywetgeving verwerkingsactiviteiten worden gesteld. Onderzoekdata kunnen ook auteursrechtelijk beschermd zijn. Aangezien de auteur de bewaargever is, is er meestal geen probleem. Er is dan een impliciete toestemming tot mededeling van de data op het SODHA-platform. Voor het regelen van deze problematiek wordt er gebruik gemaakt van het creative commons-licentiemodel in overeenstemming met de regels en gebruiken opgelegd door CESSDA en DARIAH rekening houdend met de Belgische en Europese regelgeving.
Begin langzaam, droom groot
In het kader van het ontwikkelingsproces van een nieuw CESSDA-data archief voor sociale- en humane wetenschappen in België dienden de nodige technische, organisatorische en juridische hordes te worden genomen. De logica voor het behoud en de valorisatie van onderzoeksgegevens is gelijkaardig aan de principes die gelden in de archiefsector, meer bepaald het bewaren van belangrijke gegevens voor toekomstig gebruik en historisch onderzoek. Sinds november 2020 is er een conforme maar bescheiden infrastructuur beschikbaar. Het grote probleem blijft echter de sustainability op lange termijn, daar de middelen voor de ontwikkeling en het onderhoud van deze infrastructuren schaars zijn en projectgebonden. Toch wordt in samenwerking met BELSPO alles in het werk gesteld om SODHA als een permanente dienst in stand te houden.
SODHA werd opgericht om tegemoet te komen aan de behoeften van onderzoekers in de sociale wetenschappen en de digitale humane wetenschappen. Toekomstige ontwikkelingen worden gestuurd door de onderzoeksinteresse en de noden van de gebruikers. Op deze manier kan het data-archief zijn relevantie behouden en zijn doelpubliek verder uitbreiden naar nieuwe groepen zoals leraren, journalisten, activisten en maatschappelijk werkers. Dankzij de idealen van transparantie en openheid wenst SODHA het grote publiek actief te betrekken en wordt het platform een katalysator voor citizen science.8
Webreferenties
- te bereiken via het adres: https://www.sodha.be
- Hoofdpagina van het SODHA-platform: https://www.sodha.be
- Webpagina van een dataset geproduceerd na afloop van een onderzoeksproject in geschiedenis: https://doi.org/10.34934/DVN/ADI7OA
- CESSDA Data Catalogue: https://datacatalogue.cessda.eu/
- Webpagina van een dataset geproduceerd na afloop van een onderzoeksproject in sociale wetenschappen: https://doi.org/10.34934/DVN/2DKXBL
- Archiefwet: https://etaamb.openjustice.be/nl/wet-van-24-juni-1955_n2010000717.html
- Meer informatie: https://www.sodha.be/guide/Texts_and_policies.html#DatasetPublishingPolicy
Références
- Kaase, Max, ‘Research Infrastructures in the Social Sciences: The Long and Winding Road’, in: Kleiner, Brian, Renschler, Isabelle, Wernli, Boris, Farago, Peter, en Joye, Dominique (eds.), Understanding Research Infrastructures in the Social Sciences, (Zurich: Seismo Press, 2013), 19.
- Kaase, ‘Research Infrastructures in the Social Sciences’, 19-20.
- Schoukens, Cathy en Delpierre, Nicolas, Fonds FI 244 - Archives des Belgian Archives for Social Sciences, BE A4006 FI 244, 1972-1998, Archives de l’Université catholique de Louvain, 2019, https://archives.uclouvain.be/atom/index.php/archives-des-belgian-archives-for-social-sciences.
- Boos, Jap, Research Ethics for Students in the Social Sciences, (Cham (Zwitserland): Springer, 2020), 202, https://doi.org/10.1007/978-3-030-48415-6.
- Schoups, Inge, Lobet-Maris, Claire, Laurent, Véronique, Poullet, Yves en Lefever, Nathalie, Studie SODA: Haalbaarheid van een data-archief voor de sociale wetenschappen, (Brussels: BELSPO, 2008), https://www.belspo.be/belspo/organisation/Publ/pub_ostc/agora/SODA_2.pdf.
- Consortium of European Social Science Data Archives (CESSDA) European Research Infrastructure Consortium (ERIC), ‘Statutes of CESSDA ERIC’, Official Journal of the European Union, C 220:ii (2017), 12, https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32017Y0708(01)#page=12.
- Lenaerts, Oliver, ‘Het online web archiveringsplatform SODHA voor onderzoeksgegevens uit de sociale en humane wetenschappen: Enige juridische context’, ABB: Archief- en bibliotheekwezen in België, te verschijnen, 2022.
- Vohland, Katrin, Land-Zandstra, Anne, Ceccaroni, Luigi, Lemmens, Rob, Perelló, Josep, Ponti, Marisa, Samson, Roeland en Wagenknecht, Katherin, ‘Chapter 1. Editorial: The Science of Citizen Science Evolves’, in: Vohland, K., Land-Zandstra, A., Ceccaroni, L., Lemmens, R., Perelló, J., Ponti, M., Samson, R. en Wagenknecht, K. (ed.), The Science of Citizen Science (Cham (Zwitserland): Springer, 2021), 1, https://doi.org/10.1007/978-3-030-58278-4_1.