Wegwijzer

Datakwaliteit en datagovernance (artikel 10): trainings-, validatie- en testdata

Vastgesteld 2026-06-22 · ≈ 2 min lezen · redactie Dirk Baaijen

Artikel 10 van de AI Act stelt eisen aan de data waarmee hoog-risico-AI wordt getraind, gevalideerd en getest. Datasets moeten relevant, representatief, zo foutloos mogelijk en volledig zijn, met aandacht voor vertekening. Datagovernance maakt deze keuzes navolgbaar.

Kort antwoord: Artikel 10 van de AI Act stelt dat hoog-risicosystemen die met data worden getraind, gebruik moeten maken van trainings-, validatie- en testdata die voldoen aan kwaliteitscriteria. De data moet relevant, voldoende representatief, zo foutloos mogelijk en volledig zijn voor het beoogde doel. Daarnaast moeten aanbieders een vorm van datagovernance toepassen die de keuzes rond die data navolgbaar maakt.

Waarom data centraal staat

De kwaliteit van een AI-systeem wordt grotendeels bepaald door de data waarmee het is getraind. Vertekende of onvolledige data leidt tot vertekende of onbetrouwbare uitkomsten — juist bij hoog-risicotoepassingen met gevolgen voor mensen. Artikel 10 verankert daarom datakwaliteit als zelfstandige verplichting, niet als bijzaak van het modelontwerp.

De kwaliteitscriteria

Artikel 10 vraagt dat de datasets, voor zover passend bij het beoogde doel:

Relevant en representatief zijn voor de personen en situaties waarop het systeem wordt toegepast.
Zo foutloos mogelijk en volledig zijn, met passende statistische eigenschappen.
Rekening houden met de specifieke geografische, contextuele, gedrags- of functionele omgeving waarin het systeem wordt gebruikt.

Volledige foutloosheid is geen absolute eis — de norm is "zo foutloos mogelijk" gegeven het doel. Dat dwingt tot een onderbouwde afweging, niet tot perfectie.

Datagovernance en vertekening

Naast de data zelf vraagt artikel 10 om governancepraktijken: documentatie van ontwerpkeuzes, herkomst en verzameling van data, aannames, en een onderzoek naar mogelijke vertekening (bias). Waar nodig mogen aanbieders bijzondere categorieën persoonsgegevens verwerken, uitsluitend om vertekening op te sporen en te corrigeren, onder strikte waarborgen. Deze keuzes horen herleidbaar te zijn — ze sluiten aan op het bredere AI-governanceraamwerk.

Verbinding met documentatie en risico

De datakeuzes uit artikel 10 horen terug in de technische documentatie (bijlage IV) en zijn input voor het risicobeheersysteem: vertekening in data is een risico dat je moet identificeren en beperken. Samen vormen ze onderdeel van het overzicht van hoog-risicoverplichtingen.

Wat te doen

Leg de herkomst vast van elke dataset: bron, verzamelmethode en aannames.
Toets representativiteit tegen de doelgroep en de gebruiksomgeving.
Onderzoek vertekening systematisch en documenteer de bevindingen.
Corrigeer waar nodig en verantwoord de keuzes, inclusief eventuele verwerking van bijzondere gegevens.
Houd datagovernance actueel wanneer data of doel wijzigen.

Een model is niet betrouwbaarder dan de data eronder; artikel 10 maakt die data toetsbaar.

Bronnen

https://eur-lex.europa.eu/eli/reg/2024/1689/oj
Verordening (EU) 2024/1689 (AI Act), artikel 10: eisen aan datakwaliteit en datagovernance voor trainings-, validatie- en testdata.
https://artificialintelligenceact.eu/article/10/
Artikel 10 AI Act: criteria voor relevante, representatieve en zo foutloos mogelijke datasets, plus aandacht voor vertekening.

Deel op LinkedIn

AI en discriminatie bij werving: hoe voorkom je bias?

AI-wervingstools kunnen onbedoeld discrimineren. De AI Act eist voor hoog-risicosystemen representatieve, op bias gecontroleerde data (art. 10) en menselijk toezicht; daarnaast gelden het gelijkebehandelingsrecht en de AVG. Bias-mitigatie is geen keuze maar een verplichting.

Loontransparantie en AI-beloningsanalyse: kansen en valkuilen

De EU-loontransparantierichtlijn (2023/970) moet uiterlijk 7 juni 2026 zijn omgezet. AI kan helpen bij equal-pay-analyse, maar introduceert ook bias-risico's in beloningsbeslissingen. Met AVG-aandachtspunten en praktische stappen voor werkgevers.

AI voor strategische personeelsplanning: meestal geen hoog-risico, mits het niet individueel wordt

AI voor strategische personeelsplanning en skills-forecasting op organisatieniveau is meestal geen hoog-risico onder de AI Act. Maar zodra het individuele beslissingen stuurt, kan het kantelen. Datakwaliteit, governance en transparantie blijven cruciaal.