Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

WIP: Glossary #90

Open
wants to merge 2 commits into
base: master
Choose a base branch
from
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
24 changes: 24 additions & 0 deletions glossaire.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,24 @@
# Glossaire

Vous trouverez dans ce document les définitions des termes, techniques ou non, utilisés dans le référentiel d'évaluation.
Ces définitions sont issues d'un travail de synthèse de nombreux documents, notamment les ressources du référentiel.
Le sens de certains termes fait encore débat dans la communauté scientifique et ces définitions servent avant tout à éclairer
le lecteur sur les termes utilisés durant la réalisation de leur évaluation.

**AIPD, PIA**
Analyse d'impact relative à la protection des données (en anglais PIA pour *Privacy impact assessment*)

**Apprentissage distribué ou fédéré (_federated learning_)**
On parle d'apprentissage distribué ou fédéré dans le cas de figure où plusieurs jeux de données distincts sont utilisés pour l'entraînement d'un modèle par apprentissage automatique. C'est le cas par exemple dans les collaborations entre partenaires disposant de jeux de données sensibles qui ne peuvent pas être réunis ou mis en commun.

**Attribut protégé**
On parle d'attribut protégé (*protected attribute* ou *protected variable* en anglais) pour désigner les attributs dont les valeurs définissent des sous-populations à risque de discrimination.

**Généalogie de bout-en-bout**
Un modèle prédictif est un objet informatique complexe qui peut évoluer au fil des apprentissages. Tracer les étapes de son élaboration et de son évolution permet d'en constituer une forme de généalogie, pré-requis pour reproduire ou auditer un modèle.

**_Privacy enhancing technologies_, PET**
La sécurité de l'apprentissage automatique (*ML security*) est un domaine en constante évolution. Dans certains cas de figure, les modèles prédictifs élaborés par apprentissage automatique sur des données confidentielles peuvent révéler des éléments de ces données confidentielles. Des techniques spécifiques permettent de réduire ce type de risques (par exemple : confidentialité différentielle, distillation...).

**Robustesse d'un modèle**
Une définition intuitive est qu'un modèle est robuste lorsque sa performance est stable quand les données d'entrée reçoivent des perturbations. Pour plus d'informations voir les ressources techniques indiquées pour l'élément d'évaluation intitulé "Validation des performances".