Lopende procedures

Zo startte The New York Times in december 2023 een procedure tegen OpenAI en zijn partner Microsoft omdat OpenAI zonder toestemming miljoenen nieuwsartikelen van The New York Times zou hebben gebruikt om haar AI-systeem te trainen. Ook over de concurrerende AI-tools van Google / Alphabet (Bard, Imagen, MusicLM, Duet AI & Gemini) loopt een vergelijkbare procedure.

Hoe voorkomt u dat uw online content – tegen uw wil in – gebruikt wordt voor AI-trainingsdoeleinden van derden? En mag dat zomaar?

Toepasselijke wetgeving

De nieuwe Europese AI-act benadrukt dat de AI-verordening geen afbreuk doet aan de handhaving van de auteursrechtregels krachtens het Unierecht (overweging 108). Op grond hiervan zou men kunnen denken dat auteursrechtelijk beschermde werken of databases – ook als die online zijn gepubliceerd – dus ook beschermd zijn tegen verveelvoudiging door AI-ontwikkelaars die content “scrapen” van het internet, zolang je als rechthebbende geen toestemming hebt gegeven (“licentie hebt verleend”) om die werken of databases te kopiëren als trainingsmateriaal voor AI-tools. Dit is echter een misvatting; in 2019 is in Europese regelgeving over auteursrechten en naburige rechten in de digitale eengemaakte markt een belangrijke uitzondering op dit oude principe uit het intellectuele eigendomsrecht (IE) gemaakt, namelijk dat (kort gezegd) tekst- en datamining van beschermd materiaal voor commerciële doeleinden is toegestaan, tenzij de rechthebbende op passende wijze een uitdrukkelijk voorbehoud daaromtrent heeft gemaakt. Machinaal leesbare middelen (bijvoorbeeld door voor scraping tools begrijpelijke regels in een robots.txt-bestand op te nemen) worden in dit verband “passend” geacht. Maakt u een dergelijk voorbehoud niet of niet op passende wijze, dan loopt u het risico niet succesvol te kunnen optreden tegen derden die rechtmatig toegang tot uw online content hebben en reproducties van uw content maken voor tekst- en datamining doeleinden.

Web scraping van (ook) persoonsgegevens?

Bij het trainen van AI-systemen is overigens niet alleen het IE-perspectief relevant, ook dient rekening te worden gehouden met privacyrechtelijke beperkingen. Als de betreffende online content tevens persoonsgegevens bevat, is web scraping ook vanuit dat perspectief vaak problematisch. Het is niet voor niets dat de Autoriteit Persoonsgegevens eerder dit jaar schreef dat scraping (lees: van persoonsgegevens) ‘bijna altijd illegaal’ is.

Over de auteurs

  • Lesley Broos

    Lesley Broos is advocaat en partner bij Kienhuis Legal. Zijn specialisme ligt in IT-recht, Cloud contracting, juridische bescherming van software, privacyrecht, SLA's.

Gerelateerd nieuws

AP: uitvoering anti-witwaswet alleen verantwoord bij aantoonbare effectiviteit en privacybescherming

De Autoriteit Persoonsgegevens (AP) plaatst kritische kanttekeningen bij een wetsvoorstel voor de Nederlandse uitvoering van nieuwe Europese anti-witwaswetregels. Het gaat om een wetsvoorstel om nieuwe Europese regels tegen witwassen en terrorismefinanciering in te voeren in Nederland. Hoewel de wetgeving veel kansen biedt om de bestrijding van financiële criminaliteit te verbeteren, leiden de nieuwe regels ook tot het verzamelen en delen van meer gevoelige persoonsgegevens en tot vergaande uitbreiding van bevoegdheden. Daarom pleit de AP voor een verplichte evaluatie en voldoende waarborgen.

Grondrechten als de 'Rode Draad' bij AI Act

De Europese AI-verordening, die vanaf augustus 2026 grotendeels van kracht wordt, markeert een historisch keerpunt in de regulering van technologie. In een nieuw rapport waarschuwt het College voor de Rechten van de Mens dat de bescherming van grondrechten geen 'invuloefening' is, maar een fundamentele verschuiving vraagt van zowel bedrijven als toezichthouders.

Datacenters zijn energiecentrales voor informatie

Elektriciteit is een unieke energiedrager: energie wordt verplaatst door elektronen. De ontdekking ervan was een evolutionair proces, maar met de ontdekking van elektromagnetische inductie door Michael Faraday werden de fundamentele natuurwetten zichtbaar en toepasbaar. Een energiedrager is geen brandstof; hij transporteert slechts energie. Die energie kan worden opgewekt met uiteenlopende brandstoffen: gas, kernenergie, zonne-energie of waterkracht. Uiteindelijk hebben al deze bronnen één historische oorsprong: de zon. Zonder de oerknal en onze zon zouden er geen aarde, geen wind of regen, geen fossiele brandstoffen en zelfs geen uranium bestaan.

VNO-NCW en MKB-Nederland kritisch op heropening UBO-register: privacy en veiligheid onvoldoende beschermd

Werkgeversorganisaties VNO-NCW en MKB-Nederland uiten stevige kritiek op het ontwerpbesluit waarmee het kabinet de toegang tot het UBO-register opnieuw wil openstellen voor personen en organisaties met een zogenoemd 'legitiem belang'. Volgens de organisaties schiet het voorstel tekort op het gebied van privacybescherming, rechtszekerheid en handhaafbaarheid, terwijl het wél vergaande toegang biedt tot zeer gevoelige persoonsgegevens.