fairAITools assessBias

Test de Robustesse avec Données Manquantes dans l'Évaluation de Biais RH

Scénario de test & Cas d'usage

Contexte Métier

Un département des ressources humaines évalue un modèle prédisant le potentiel de promotion des employés. Le jeu de données est incomplet et contient des valeurs manquantes pour la variable sensible (genre) et pour certaines prédictions. Ce scénario teste la capacité de l'action à gérer ces cas limites.
À propos du Set : fairAITools

Détection et atténuation des biais dans les modèles IA.

Découvrir toutes les actions de fairAITools
Préparation des Données

Création d'une table d'employés où certains enregistrements ont des valeurs manquantes pour le genre ou la probabilité de promotion prédite.

Copié !
1DATA casuser.PROMOTION_CANDIDATES;
2 call streaminit(789);
3 DO i = 1 to 2000;
4 rand_gender = rand('UNIFORM');
5 IF rand_gender < 0.48 THEN GENDER = 'M';
6 ELSE IF rand_gender < 0.96 THEN GENDER = 'F';
7 ELSE GENDER = ''; /* Valeur manquante */
8 
9 P_PROMOTION = rand('UNIFORM');
10 IF rand('UNIFORM') < 0.05 THEN P_PROMOTION = .; /* Valeur manquante numérique */
11 
12 IF P_PROMOTION > 0.8 THEN IS_PROMOTED = 1; ELSE IS_PROMOTED = 0;
13 OUTPUT;
14 END;
15RUN;

Étapes de réalisation

1
Chargement de la table des candidats à la promotion en CAS.
Copié !
1 
2PROC CASUTIL;
3load
4DATA=casuser.PROMOTION_CANDIDATES outcaslib='casuser' replace;
5QUIT;
6 
2
Exécution de l'action assessBias sur le jeu de données contenant des valeurs manquantes.
Copié !
1PROC CAS;
2 fairAITools.assessBias
3 TABLE={name='PROMOTION_CANDIDATES', caslib='casuser'},
4 response={name='IS_PROMOTED'},
5 sensitiveVariable={name='GENDER'},
6 predictedVariables={{name='P_PROMOTION'}},
7 event='1',
8 cutoff=0.6;
9RUN;
10QUIT;

Résultat Attendu


L'action doit s'exécuter sans erreur en ignorant automatiquement les enregistrements où la variable sensible ('GENDER') ou la variable prédite ('P_PROMOTION') sont manquantes. Les métriques de biais calculées ne doivent concerner que les groupes 'M' et 'F' pour lesquels des données complètes sont disponibles, démontrant la robustesse de l'action face à des données imparfaites.