Uitleg

AI en auteursrecht: mag je beschermd materiaal gebruiken als trainingsdata?

Vastgesteld 2026-06-19 · ≈ 3 min lezen · redactie Dirk Baaijen

Commerciële AI-training in de EU leunt op de tekst- en datamining-uitzondering (art. 4 DSM-richtlijn): die geldt tenzij de rechthebbende een machineleesbaar voorbehoud maakte. De AI Act verplicht GPAI-aanbieders dat te respecteren. Op zuiver machinale output rust meestal geen auteursrecht.

Kort antwoord: Voor het trainen van AI-modellen op auteursrechtelijk beschermd materiaal leunt commerciële AI in de EU op de uitzondering voor tekst- en datamining (art. 4 van de DSM-richtlijn 2019/790). Die uitzondering geldt automatisch, maar alléén als de rechthebbende geen voorbehoud heeft gemaakt — en dat voorbehoud moet machineleesbaar zijn. De AI Act bouwt hierop voort: aanbieders van AI-modellen voor algemene doeleinden (GPAI) moeten dat voorbehoud respecteren en een voldoende gedetailleerde samenvatting van de gebruikte trainingsdata publiceren. Op de output van AI rust in beginsel geen auteursrecht, tenzij er een menselijke creatieve keuze aan ten grondslag ligt.

Twee verschillende vragen

Bij "AI en auteursrecht" lopen twee vragen door elkaar die juridisch los van elkaar staan:

De input: mag je beschermd werk (teksten, beelden, code) gebruiken om een model te trainen?
De output: wie heeft het auteursrecht op wat een AI-systeem produceert?

Het antwoord op beide is in de EU verrassend specifiek geregeld — maar niet in één wet.

De input: de tekst- en datamining-uitzondering

Het kopiëren van beschermd werk om er patronen uit te halen ("tekst- en datamining", TDM) is in beginsel een auteursrechtelijk relevante handeling. De DSM-richtlijn (EU) 2019/790 voorziet in twee uitzonderingen:

Artikel 3 — TDM voor wetenschappelijk onderzoek door onderzoeksorganisaties en erfgoedinstellingen. Hierop kan géén voorbehoud worden gemaakt; deze uitzondering is dwingend.
Artikel 4 — een algemene TDM-uitzondering die óók voor commerciële doeleinden geldt, waaronder het trainen van commerciële AI-modellen. Maar deze geldt alleen voor zover de rechthebbende het gebruik niet uitdrukkelijk heeft voorbehouden ("opt-out"). Bij online beschikbaar materiaal moet dat voorbehoud op een machineleesbare manier kenbaar zijn.

De praktische kern: wie commercieel een model traint, leunt op artikel 4 — en dus telt het opt-out van de rechthebbende. Steeds meer uitgevers en makers maken zo'n machineleesbaar voorbehoud (bijvoorbeeld via metadata of het robots-/TDM-protocol op hun site).

Wat de AI Act daaraan toevoegt

De AI Act (Verordening (EU) 2024/1689) maakt het auteursrecht onderdeel van de modelverplichtingen. Aanbieders van GPAI-modellen moeten op grond van artikel 53:

een beleid voeren om het EU-auteursrecht na te leven, en in het bijzonder het voorbehoud uit artikel 4, lid 3, van de DSM-richtlijn te identificeren en te respecteren;
een voldoende gedetailleerde samenvatting publiceren van de inhoud die voor de training is gebruikt, volgens een model dat het AI Office beschikbaar stelt.

Belangrijk is de reikwijdte: deze plicht geldt ook voor modellen die buiten de EU zijn getraind, zodra ze in de EU op de markt komen (recital 106). Het EU-auteursrecht volgt zo het model naar de markt, niet de plaats van training. De GPAI-gedragscode bevat een apart hoofdstuk auteursrecht waarmee aanbieders kunnen aantonen dat ze aan deze plichten voldoen.

De output: wie is de auteur?

Het Europese auteursrecht beschermt werk dat een "eigen intellectuele schepping" van de maker is — een maatstaf die het Hof van Justitie heeft ontwikkeld (onder meer in Infopaq en Painer). Daarin zit een menselijke voorwaarde: er moeten vrije, creatieve keuzes van een mens aan ten grondslag liggen.

Daaruit volgt dat op zuiver machinaal gegenereerde output, zonder menselijke creatieve inbreng, in beginsel geen auteursrecht rust. Geeft een mens daarentegen door selectie, bewerking of gerichte instructies een eigen creatieve stempel aan het eindresultaat, dan kan dat resultaat wél beschermd zijn. Waar precies de grens ligt, is casuïstisch en nog volop in ontwikkeling.

Wat dit betekent voor de praktijk

Gebruik je een extern AI-model? Leg in het contract met de leverancier vast hoe is omgegaan met trainingsdata en wie aansprakelijk is bij een inbreukclaim (vrijwaring).
Ben je rechthebbende? Wil je niet dat je werk wordt gebruikt voor AI-training, maak dan een machineleesbaar voorbehoud — een mondeling of in algemene voorwaarden verstopt voorbehoud is onvoldoende.
Werk je met AI-output? Ga er niet automatisch van uit dat je daar auteursrecht op hebt. Wil je exclusiviteit, regel die dan contractueel en zorg voor aantoonbare menselijke creatieve inbreng.

Auteursrecht en trainingsdata zijn geen randvraag meer: het is een van de scherpste snijvlakken tussen de AI Act, de DSM-richtlijn en het klassieke auteursrecht — en een onderwerp waar de eerste handhaving en jurisprudentie nog moeten landen.

Bronnen

https://eur-lex.europa.eu/eli/dir/2019/790/oj
Richtlijn (EU) 2019/790 (DSM-richtlijn auteursrecht), art. 3 en 4: de tekst- en datamining-uitzonderingen.
https://eur-lex.europa.eu/eli/reg/2024/1689/oj
Verordening (EU) 2024/1689 (AI Act), art. 53 en recitals 104-107: auteursrechtbeleid en samenvatting trainingsdata voor GPAI.
https://digital-strategy.ec.europa.eu/en/policies/ai-code-practice
Europese Commissie — GPAI-gedragscode, met een apart hoofdstuk auteursrecht.

Deel op LinkedIn

AI en auteursrecht: mag je beschermd materiaal gebruiken als trainingsdata?

Twee verschillende vragen

De input: de tekst- en datamining-uitzondering

Wat de AI Act daaraan toevoegt

De output: wie is de auteur?

Wat dit betekent voor de praktijk

Bronnen

Lees ook

De GPAI-gedragscode (Code of Practice): wat staat erin en voor wie?

AI, energieverbruik en duurzaamheidsrapportage

Het AI Office: rol, taken en handhavingsbevoegdheden

De maandelijkse briefing