Audit RH avec Gestion des Valeurs Manquantes et Doublons

Contexte Métier

Lors d'une fusion d'entreprises, le service RH compare deux fichiers de personnel. Le défi est double : certains employés ont des codes département manquants (NULL) qui doivent être traités comme des groupes valides, et il existe des doublons (employés ayant plusieurs postes) qui doivent tous être conservés dans l'analyse.

Préparation des Données

Création de données RH avec des valeurs manquantes et des doublons d'ID.

Copié !

1	DATA casuser.RH_SOURCE; LENGTH EmpID $5 Dept $10; INPUT EmpID $ Dept $; DATALINES;
2	E01 IT
3	E01 IT
4	E02 HR
5	E03 .
6	E04 Sales
7	; RUN;
8
9	DATA casuser.RH_CIBLE; LENGTH EmpID $5 Dept $10; INPUT EmpID $ Dept $; DATALINES;
10	E01 IT
11	E02 Finance
12	E03 .
13	E05 Sales
14	; RUN;

Étapes de réalisation

Comparaison stricte incluant les valeurs manquantes et les doublons.

Copié !

1	PROC CAS;
2	SIMPLE.compare /
3	TABLE={name='RH_SOURCE', groupBy={'EmpID', 'Dept'}},
4	table2={name='RH_CIBLE', groupBy={'EmpID', 'Dept'}},
5	includeMissing=true,
6	includeDuplicates={'CASOUT', 'CASOUT2'},
7	casOut={name='ANOMALIES_SOURCE', replace=true},
8	casOut2={name='ANOMALIES_CIBLE', replace=true};
9	RUN;

Résultat Attendu

1. L'employé E03 (Dept manquant) doit être correctement apparié (pas d'erreur). 2. L'employé E01 (doublon dans Source) doit apparaître une fois dans 'ANOMALIES_SOURCE' car la cible n'en a qu'un seul, ou être géré selon la logique de fréquence. 3. E02 apparaîtra dans les deux tables d'anomalies car le département diffère (HR vs Finance).

Voir la documentation technique de compare