simple compare

Audit RH avec Gestion des Valeurs Manquantes et Doublons

Scénario de test & Cas d'usage

Contexte Métier

Lors d'une fusion d'entreprises, le service RH compare deux fichiers de personnel. Le défi est double : certains employés ont des codes département manquants (NULL) qui doivent être traités comme des groupes valides, et il existe des doublons (employés ayant plusieurs postes) qui doivent tous être conservés dans l'analyse.
Préparation des Données

Création de données RH avec des valeurs manquantes et des doublons d'ID.

Copié !
1DATA casuser.RH_SOURCE; LENGTH EmpID $5 Dept $10; INPUT EmpID $ Dept $; DATALINES;
2E01 IT
3E01 IT
4E02 HR
5E03 .
6E04 Sales
7; RUN;
8 
9DATA casuser.RH_CIBLE; LENGTH EmpID $5 Dept $10; INPUT EmpID $ Dept $; DATALINES;
10E01 IT
11E02 Finance
12E03 .
13E05 Sales
14; RUN;

Étapes de réalisation

1
Comparaison stricte incluant les valeurs manquantes et les doublons.
Copié !
1PROC CAS;
2 SIMPLE.compare /
3 TABLE={name='RH_SOURCE', groupBy={'EmpID', 'Dept'}},
4 table2={name='RH_CIBLE', groupBy={'EmpID', 'Dept'}},
5 includeMissing=true,
6 includeDuplicates={'CASOUT', 'CASOUT2'},
7 casOut={name='ANOMALIES_SOURCE', replace=true},
8 casOut2={name='ANOMALIES_CIBLE', replace=true};
9RUN;

Résultat Attendu


1. L'employé E03 (Dept manquant) doit être correctement apparié (pas d'erreur). 2. L'employé E01 (doublon dans Source) doit apparaître une fois dans 'ANOMALIES_SOURCE' car la cible n'en a qu'un seul, ou être géré selon la logique de fréquence. 3. E02 apparaîtra dans les deux tables d'anomalies car le département diffère (HR vs Finance).