Lopende procedures

Zo startte The New York Times in december 2023 een procedure tegen OpenAI en zijn partner Microsoft omdat OpenAI zonder toestemming miljoenen nieuwsartikelen van The New York Times zou hebben gebruikt om haar AI-systeem te trainen. Ook over de concurrerende AI-tools van Google / Alphabet (Bard, Imagen, MusicLM, Duet AI & Gemini) loopt een vergelijkbare procedure.

Hoe voorkomt u dat uw online content – tegen uw wil in – gebruikt wordt voor AI-trainingsdoeleinden van derden? En mag dat zomaar?

Toepasselijke wetgeving

De nieuwe Europese AI-act benadrukt dat de AI-verordening geen afbreuk doet aan de handhaving van de auteursrechtregels krachtens het Unierecht (overweging 108). Op grond hiervan zou men kunnen denken dat auteursrechtelijk beschermde werken of databases – ook als die online zijn gepubliceerd – dus ook beschermd zijn tegen verveelvoudiging door AI-ontwikkelaars die content “scrapen” van het internet, zolang je als rechthebbende geen toestemming hebt gegeven (“licentie hebt verleend”) om die werken of databases te kopiëren als trainingsmateriaal voor AI-tools. Dit is echter een misvatting; in 2019 is in Europese regelgeving over auteursrechten en naburige rechten in de digitale eengemaakte markt een belangrijke uitzondering op dit oude principe uit het intellectuele eigendomsrecht (IE) gemaakt, namelijk dat (kort gezegd) tekst- en datamining van beschermd materiaal voor commerciële doeleinden is toegestaan, tenzij de rechthebbende op passende wijze een uitdrukkelijk voorbehoud daaromtrent heeft gemaakt. Machinaal leesbare middelen (bijvoorbeeld door voor scraping tools begrijpelijke regels in een robots.txt-bestand op te nemen) worden in dit verband “passend” geacht. Maakt u een dergelijk voorbehoud niet of niet op passende wijze, dan loopt u het risico niet succesvol te kunnen optreden tegen derden die rechtmatig toegang tot uw online content hebben en reproducties van uw content maken voor tekst- en datamining doeleinden.

Web scraping van (ook) persoonsgegevens?

Bij het trainen van AI-systemen is overigens niet alleen het IE-perspectief relevant, ook dient rekening te worden gehouden met privacyrechtelijke beperkingen. Als de betreffende online content tevens persoonsgegevens bevat, is web scraping ook vanuit dat perspectief vaak problematisch. Het is niet voor niets dat de Autoriteit Persoonsgegevens eerder dit jaar schreef dat scraping (lees: van persoonsgegevens) ‘bijna altijd illegaal’ is.

Gerelateerd nieuws

NJCM waarschuwt dat Europese digitale ‘vereenvoudiging’ kan leiden tot aantasting mensenrechten

Onlangs zijn er voorstellen van de Europese Commissie om Europese digitale regels aan te passen uitgelekt (‘Digital Omnibus’). De Commissie beoogt met dit Omnibus-pakket een administratieve vereenvoudiging door middel van het wijzigen van bestaande wetgeving, waaronder de Algemene Verordening Gegevensbescherming (AVG), ePrivacy-richtlijn en de AI-Act.

Gepseudonimiseerde of geanonimiseerde gegevens? Hof van Justitie van de Europese Unie geeft duidelijkheid

In een eerdere blog schreef ik over de uitspraak van het Gerecht van de Europese Unie waarin opheldering werd gegeven over de vraag wanneer een gegeven als voldoende anoniem mag worden beschouwd en daarmee niet langer een persoonsgegeven is. In een recent arrest van het Hof van Justitie van de Europese Unie ('HvJ EU') wordt deze uitspraak van het Gerecht echter herzien. Het HvJ EU oordeelt opnieuw in de discussie rondom pseudonieme en anonieme persoonsgegevens.

Code, chaos en controle: wat overheden van software kunnen leren

De software pionier Douglas McIlroy stelde: ‘De echte held van programmeren, is degene die negatieve code schrijft’, waar negatieve code wordt opgevat als regelreductie. Met steeds minder code dezelfde functionaliteit blijven leveren. Dat houdt systemen agile en sustainable. Datzelfde principe zou de overheid moeten omarmen: negatieve wetsregels — nieuwe wetten die meer wetsregels elimineren dan ze zelf toevoegen.

Bestuurders en de Cyberbeveiligingswet

In het tweede kwartaal van 2026 treedt naar verwachting de Cyberbeveiligingswet (“Cbw”) in werking. De Cbw heeft tot doel de cyberverplichtingen voor entiteiten in sectoren met maatschappelijk of economisch gewicht te versterken. Ook bevat de Cbw bepalingen over het toezicht, de handhaving en aanvullende verantwoordelijkheden voor bestuurders van zogeheten essentiële of belangrijke entiteiten.

Data & Privacy