Tekst- en datamining: wat is het en wanneer mag ik het toepassen?

Aankoopgedrag van consumenten of symptomen van bepaalde patiëntengroepen in kaart brengen? Dat kan door middel van datamining; ook wel gegevensdelving genoemd. Dit is het gericht zoeken naar (statistische) verbanden tussen verschillende gegevensverzamelingen met als doel profielen op te stellen voor wetenschappelijk, journalistiek of commercieel gebruik. Nieuwe technologieën maken het mogelijk om informatie in digitale vorm – zoals tekst, geluid, beeld en data – geautomatiseerd te doorzoeken om zo bepaalde onderlinge verbanden of patronen te kunnen identificeren. Tekst- en dataminingtechnieken worden door zowel private als publieke entiteiten veelvuldig gebruikt om grote hoeveelheden gegevens te analyseren. Deze technieken worden onder andere toegepast in medische onderzoeken naar ziekten en geneesmiddelen, in het kader van kunstmatige intelligentie (zoals zelfrijdende auto’s of spraakgestuurde navigatiesystemen), ter ontwikkeling van instrumenten om cyberdreigingen het hoofd te bieden en in het kader van onderzoeksjournalistiek.

18 jun. 2020

Er is een wijziging van de Auteurswet in de maak die regelt onder welke voorwaarden tekst- en datamining mag worden toegepast.

Op tekst, geluid, beeld en data rust in beginsel namelijk auteursrecht. Tekst- en datamining toepassen op auteursrechtelijk beschermde werken kon voorheen derhalve niet zonder toestemming van de auteursrechthebbende. In het wetsvoorstel zijn echter twee beperkingen opgenomen op het auteursrechtelijke reproductierecht van de maker.

Tekst- en datamining door onderzoeksorganisaties en culturele erfgoedinstellingen

Allereerst is in het wetsvoorstel opgenomen dat onderzoeksorganisaties en culturele erfgoedinstellingen kopieën van tekst, geluid, beeld en data (en allerlei andere werken van letterkunde, wetenschap of kunst) mogen maken ten behoeve van tekst- en datamining voor wetenschappelijk onderzoek. Daar hoeven zij dus geen toestemming van de maker voor te vragen en ook geen vergoeding voor te betalen. Dit recht om tekst- en datamining toe te passen geldt uitsluitend voor onderzoeksorganisaties en culturele erfgoedinstellingen. Denk bijvoorbeeld aan universiteiten en andere instellingen voor hoger onderwijs, onderzoeksinstituten, ziekenhuizen, bibliotheken, musea en archieven. Bovendien gelden er twee voorwaarden:

  • de toepassing van tekst- en datamining moet geschieden in het kader van wetenschappelijk onderzoek;
  • de onderzoeksorganisaties en/of culturele erfgoedinstellingen moeten rechtmatig toegang tot de betreffende werken hebben verkregen.

Tekst- en datamining door anderen

Daarnaast is in het wetsvoorstel een algemene beperking opgenomen, op grond waarvan ook anderen dan onderzoeksorganisaties en culturele erfgoedinstellingen auteursrechtelijk beschermde werken mogen reproduceren voor tekst- en datamining. Dit is een meer algemene bepaling, met name bedoeld voor private en publieke entiteiten die grote hoeveelheden gegevens willen analyseren op verschillende gebieden van het leven en voor verschillende doeleinden. De uitzondering is bedoeld om ook in de private sector innovatie aan te moedigen. Ook hier geldt dat rechtmatig toegang tot het betreffende werk moet zijn verkregen. De voorwaarde dat de tekst- en datamining moet geschieden in het kader van wetenschappelijk onderzoek geldt in dit geval niet. De rechthebbende kan het gebruik op grond van deze beperking echter wel uitdrukkelijk voorbehouden, bijvoorbeeld door dit bij het werk te vermelden. In dat geval mag het werk dus niet worden gebruikt voor tekst- en datamining.

Meer info: zie ons eerdere blog over deze Richtlijn 2019/790 (ook wel de ‘Auteursrechtrichtlijn’ genoemd), welke uiterlijk op 7 juni 2021 in Nederlands recht moet zijn omgezet.