Bescherm uw online content tegen web scraping door AI aanbieders

Wereldwijd lopen er momenteel rechtszaken tegen aanbieders en ontwikkelaars van (veelal general purpose) AI-tools die hun systemen hebben getraind met grote hoeveelheden data waarop auteursrechten of databankrechten van derden rusten.

27 september 2024

Data ethiek

Data

Lopende procedures

Zo startte The New York Times in december 2023 een procedure tegen OpenAI en zijn partner Microsoft omdat OpenAI zonder toestemming miljoenen nieuwsartikelen van The New York Times zou hebben gebruikt om haar AI-systeem te trainen. Ook over de concurrerende AI-tools van Google / Alphabet (Bard, Imagen, MusicLM, Duet AI & Gemini) loopt een vergelijkbare procedure.

Hoe voorkomt u dat uw online content – tegen uw wil in – gebruikt wordt voor AI-trainingsdoeleinden van derden? En mag dat zomaar?

Toepasselijke wetgeving

De nieuwe Europese AI-act benadrukt dat de AI-verordening geen afbreuk doet aan de handhaving van de auteursrechtregels krachtens het Unierecht (overweging 108). Op grond hiervan zou men kunnen denken dat auteursrechtelijk beschermde werken of databases – ook als die online zijn gepubliceerd – dus ook beschermd zijn tegen verveelvoudiging door AI-ontwikkelaars die content “scrapen” van het internet, zolang je als rechthebbende geen toestemming hebt gegeven (“licentie hebt verleend”) om die werken of databases te kopiëren als trainingsmateriaal voor AI-tools. Dit is echter een misvatting; in 2019 is in Europese regelgeving over auteursrechten en naburige rechten in de digitale eengemaakte markt een belangrijke uitzondering op dit oude principe uit het intellectuele eigendomsrecht (IE) gemaakt, namelijk dat (kort gezegd) tekst- en datamining van beschermd materiaal voor commerciële doeleinden is toegestaan, tenzij de rechthebbende op passende wijze een uitdrukkelijk voorbehoud daaromtrent heeft gemaakt. Machinaal leesbare middelen (bijvoorbeeld door voor scraping tools begrijpelijke regels in een robots.txt-bestand op te nemen) worden in dit verband “passend” geacht. Maakt u een dergelijk voorbehoud niet of niet op passende wijze, dan loopt u het risico niet succesvol te kunnen optreden tegen derden die rechtmatig toegang tot uw online content hebben en reproducties van uw content maken voor tekst- en datamining doeleinden.

Web scraping van (ook) persoonsgegevens?

Bij het trainen van AI-systemen is overigens niet alleen het IE-perspectief relevant, ook dient rekening te worden gehouden met privacyrechtelijke beperkingen. Als de betreffende online content tevens persoonsgegevens bevat, is web scraping ook vanuit dat perspectief vaak problematisch. Het is niet voor niets dat de Autoriteit Persoonsgegevens eerder dit jaar schreef dat scraping (lees: van persoonsgegevens) ‘bijna altijd illegaal’ is.

Over de auteurs

Lesley Broos

Lesley Broos is advocaat en partner bij Kienhuis Legal. Zijn specialisme ligt in IT-recht, Cloud contracting, juridische bescherming van software, privacyrecht, SLA's.

Gerelateerd nieuws

Een strategische aanpak voor het beheren van AI-risico's

26 november 2025

Kunstmatige intelligentie (AI) verandert het bedrijfsleven in een ongekend tempo. Vooral Generatieve AI heeft de verwachtingen van experts ver overtroffen en decennia aan voorspelde vooruitgang samengeperst in slechts enkele jaren. Tegen 2028 verwacht 62% van de bedrijfsleiders dat AI in alle onderdelen van hun organisatie is geïntegreerd. Maar terwijl 45% AI ziet als een grote kans, maakt 56% zich zorgen over de cybersecurity- en privacyrisico’s die gepaard gaan met deze snelle adoptie.

Van Data tot Intelligence: cirkel van inzicht en actie

25 november 2025

We leven in een tijd waarin data als het nieuwe goud wordt gezien. Iedere organisatie verzamelt, meet, modelleert en bewaart — alsof méér data vanzelf leidt tot méér kennis. Maar data is geen doel. Het is slechts de grondstof voor begrip. Pas wanneer we van data de creator kennen en het kunnen ordenen, duiden en plaatsen in context, ontstaat echte informatie. En wanneer die informatie voor de gebruiker betekenis krijgt, ontstaat intelligence — inzicht waarop je kunt handelen.

Clare’s Law tegen huiselijk geweld in Nederland: redmiddel of risico?

21 november 2025

In het eerste halfjaar ontving Veilig Thuis ruim 66.000 meldingen van huiselijk geweld. Een stijging van 10 procent vergeleken met dezelfde periode in 2022. Terwijl deze cijfers toenemen, groeit ook de roep om slachtoffers beter te beschermen. Steeds vaker valt daarbij de naam Clare’s Law, een Britse wet waarmee politie-informatie over het geweldsverleden van (potentiële) partners kan worden gedeeld.

Zorg & Sociaal

EU-wetswijzingen 'digitale omnibus' zorgelijk voor grondrechten

20 november 2025

Vandaag publiceert de Europese Commissie een voorstel om de digitale EU-regelgeving te versimpelen, de zogenaamde digitale omnibus. De verordeningen over AI en gegevensbescherming vormen daarin een belangrijk onderdeel. Het College voor de Rechten van de Mens signaleert een zorgwekkende afzwakking van de bescherming van grondrechten in het omnibusvoorstel.

Meer nieuws