Lopende procedures

Zo startte The New York Times in december 2023 een procedure tegen OpenAI en zijn partner Microsoft omdat OpenAI zonder toestemming miljoenen nieuwsartikelen van The New York Times zou hebben gebruikt om haar AI-systeem te trainen. Ook over de concurrerende AI-tools van Google / Alphabet (Bard, Imagen, MusicLM, Duet AI & Gemini) loopt een vergelijkbare procedure.

Hoe voorkomt u dat uw online content – tegen uw wil in – gebruikt wordt voor AI-trainingsdoeleinden van derden? En mag dat zomaar?

Toepasselijke wetgeving

De nieuwe Europese AI-act benadrukt dat de AI-verordening geen afbreuk doet aan de handhaving van de auteursrechtregels krachtens het Unierecht (overweging 108). Op grond hiervan zou men kunnen denken dat auteursrechtelijk beschermde werken of databases – ook als die online zijn gepubliceerd – dus ook beschermd zijn tegen verveelvoudiging door AI-ontwikkelaars die content “scrapen” van het internet, zolang je als rechthebbende geen toestemming hebt gegeven (“licentie hebt verleend”) om die werken of databases te kopiëren als trainingsmateriaal voor AI-tools. Dit is echter een misvatting; in 2019 is in Europese regelgeving over auteursrechten en naburige rechten in de digitale eengemaakte markt een belangrijke uitzondering op dit oude principe uit het intellectuele eigendomsrecht (IE) gemaakt, namelijk dat (kort gezegd) tekst- en datamining van beschermd materiaal voor commerciële doeleinden is toegestaan, tenzij de rechthebbende op passende wijze een uitdrukkelijk voorbehoud daaromtrent heeft gemaakt. Machinaal leesbare middelen (bijvoorbeeld door voor scraping tools begrijpelijke regels in een robots.txt-bestand op te nemen) worden in dit verband “passend” geacht. Maakt u een dergelijk voorbehoud niet of niet op passende wijze, dan loopt u het risico niet succesvol te kunnen optreden tegen derden die rechtmatig toegang tot uw online content hebben en reproducties van uw content maken voor tekst- en datamining doeleinden.

Web scraping van (ook) persoonsgegevens?

Bij het trainen van AI-systemen is overigens niet alleen het IE-perspectief relevant, ook dient rekening te worden gehouden met privacyrechtelijke beperkingen. Als de betreffende online content tevens persoonsgegevens bevat, is web scraping ook vanuit dat perspectief vaak problematisch. Het is niet voor niets dat de Autoriteit Persoonsgegevens eerder dit jaar schreef dat scraping (lees: van persoonsgegevens) ‘bijna altijd illegaal’ is.

Over de auteurs

  • Lesley Broos

    Lesley Broos is advocaat en partner bij Kienhuis Legal. Zijn specialisme ligt in IT-recht, Cloud contracting, juridische bescherming van software, privacyrecht, SLA's.

Gerelateerd nieuws

Public cloud en de Rijksoverheid in de praktijk

We kunnen niet meer om het onderwerp heen: public cloud zoals aangeboden door onder andere Microsoft (Azure), Amazon (AWS) en Google (GCP) wordt door de Rijksoverheid steeds meer gebruikt. De komende jaren zullen we tijdens onze onderzoeken steeds vaker informatiesystemen tegenkomen die gebruik maken van de public cloud en gevraagd worden om hier iets van te vinden.

Data & Privacy

Onderzoek naar informatiebeveiliging is ‘wake up-call’

Een ADR-onderzoek naar de omgang met vertrouwelijke informatie bij de politie toont aan dat de beveiliging van die informatie onvoldoende op orde is. Het korps is te kwetsbaar voor kwaadwillenden die op zoek zijn naar politie-informatie. Naar aanleiding van het rapport heeft de politie direct maatregelen genomen.

Data & Privacy

Het belang van meer aandacht voor IT en cybersecurity voor de jeugd

De digitalisering van onze samenleving verloopt in een razend tempo. Informatie en operationele technologieën zijn niet meer weg te denken uit ons leven. Het samenkomen van computers, wereldwijde connectiviteit, mobiele apparatuur, robotisering, cloud technologie en Artificiële Intelligentie (AI) transformeert onze wereld. Daarin ligt een potentiële belofte dat alles sneller, efficiënter, beter en gemakkelijker wordt, overal en continue. Deze digitalisering en technologische ontwikkelingen bieden kansen en mogelijkheden voor zowel organisaties als de samenleving.

Data & Privacy

Nederland wil met 8 landen EU-regels digitale economie vereenvoudigen

Meer dan 10 nieuwe EU-wetten voor de digitale economie zijn van kracht of komen eraan. Die verbeteren concurrentie en consumentenbescherming op terreinen als digitale platforms, kunstmatige intelligentie, productveiligheid en data. Al deze regels bij elkaar kunnen echter ook onsamenhangend of overlappend zijn en zo onnodig mkb-ondernemers belemmeren. Minister Dirk Beljaarts (Economische Zaken) heeft vandaag bij de EU Telecomraad in Brussel met België, Duitsland, Estland, Finland, Griekenland, Ierland, Slowakije en Zweden de Europese Commissie opgeroepen om dit aan te pakken.

Data & Privacy