Bescherm uw online content tegen web scraping door AI aanbieders

Wereldwijd lopen er momenteel rechtszaken tegen aanbieders en ontwikkelaars van (veelal general purpose) AI-tools die hun systemen hebben getraind met grote hoeveelheden data waarop auteursrechten of databankrechten van derden rusten.

27 september 2024

Data ethiek

Data

Lopende procedures

Zo startte The New York Times in december 2023 een procedure tegen OpenAI en zijn partner Microsoft omdat OpenAI zonder toestemming miljoenen nieuwsartikelen van The New York Times zou hebben gebruikt om haar AI-systeem te trainen. Ook over de concurrerende AI-tools van Google / Alphabet (Bard, Imagen, MusicLM, Duet AI & Gemini) loopt een vergelijkbare procedure.

Hoe voorkomt u dat uw online content – tegen uw wil in – gebruikt wordt voor AI-trainingsdoeleinden van derden? En mag dat zomaar?

Toepasselijke wetgeving

De nieuwe Europese AI-act benadrukt dat de AI-verordening geen afbreuk doet aan de handhaving van de auteursrechtregels krachtens het Unierecht (overweging 108). Op grond hiervan zou men kunnen denken dat auteursrechtelijk beschermde werken of databases – ook als die online zijn gepubliceerd – dus ook beschermd zijn tegen verveelvoudiging door AI-ontwikkelaars die content “scrapen” van het internet, zolang je als rechthebbende geen toestemming hebt gegeven (“licentie hebt verleend”) om die werken of databases te kopiëren als trainingsmateriaal voor AI-tools. Dit is echter een misvatting; in 2019 is in Europese regelgeving over auteursrechten en naburige rechten in de digitale eengemaakte markt een belangrijke uitzondering op dit oude principe uit het intellectuele eigendomsrecht (IE) gemaakt, namelijk dat (kort gezegd) tekst- en datamining van beschermd materiaal voor commerciële doeleinden is toegestaan, tenzij de rechthebbende op passende wijze een uitdrukkelijk voorbehoud daaromtrent heeft gemaakt. Machinaal leesbare middelen (bijvoorbeeld door voor scraping tools begrijpelijke regels in een robots.txt-bestand op te nemen) worden in dit verband “passend” geacht. Maakt u een dergelijk voorbehoud niet of niet op passende wijze, dan loopt u het risico niet succesvol te kunnen optreden tegen derden die rechtmatig toegang tot uw online content hebben en reproducties van uw content maken voor tekst- en datamining doeleinden.

Web scraping van (ook) persoonsgegevens?

Bij het trainen van AI-systemen is overigens niet alleen het IE-perspectief relevant, ook dient rekening te worden gehouden met privacyrechtelijke beperkingen. Als de betreffende online content tevens persoonsgegevens bevat, is web scraping ook vanuit dat perspectief vaak problematisch. Het is niet voor niets dat de Autoriteit Persoonsgegevens eerder dit jaar schreef dat scraping (lees: van persoonsgegevens) ‘bijna altijd illegaal’ is.

Over de auteurs

Lesley Broos

Lesley Broos is advocaat en partner bij Kienhuis Legal. Zijn specialisme ligt in IT-recht, Cloud contracting, juridische bescherming van software, privacyrecht, SLA's.

Gerelateerd nieuws

Algoritmeregistratie in Nederland moet beter

11 juli 2025

Overheden en organisaties boeken te weinig voortgang met de registratie van de algoritme- en AI-systemen die zij gebruiken. Hierdoor is het voor burgers en klanten vaak niet duidelijk waarvoor en hoe overheden en organisaties AI en algoritmes gebruiken. Een compleet algoritmeregister is de basis voor transparantie, bescherming van grondrechten, uitlegbaarheid en controleerbaarheid bij de inzet van algoritmes en AI.

Data & Privacy

Hoe AI de structuur van organisaties hervormt

9 juli 2025

Kunstmatige intelligentie (AI) is al lang niet meer iets voor enkel de IT-afdeling binnen een organisatie: meer dan de helft van werkend Nederland zet AI in om hun eigen productiviteit te verhogen, zo blijkt uit een wereldwijd onderzoek van het Amerikaanse softwarebedrijf Freshworks.

Digitale soevereiniteit is een politieke keuze

9 juli 2025

Onze samenleving digitaliseert in razend tempo. Van zorg en onderwijs tot belastingaangifte en communicatie: vrijwel alles verloopt tegenwoordig (deels) digitaal. Tegelijkertijd verliezen we als samenleving de grip op de technologie die dit mogelijk maakt.

Data & Privacy

Waarom je als General Counsel nú werk moet maken van een Fundamental Rights Impact Assessment (FRIA)

12 juni 2025

Welke ethische afwegingen maak je als General Counsel bij de inzet van AI? De FRIA (Fundamental Rights Impact Assessment) helpt om risico’s voor grondrechten vroegtijdig te signaleren. Lees waarom dit essentieel is en hoe het bijdraagt aan compliance, transparantie en vertrouwen.

Meer nieuws