Scénario de test & Cas d'usage
Création de données RH avec des valeurs manquantes et des doublons d'ID.
| 1 | DATA casuser.RH_SOURCE; LENGTH EmpID $5 Dept $10; INPUT EmpID $ Dept $; DATALINES; |
| 2 | E01 IT |
| 3 | E01 IT |
| 4 | E02 HR |
| 5 | E03 . |
| 6 | E04 Sales |
| 7 | ; RUN; |
| 8 | |
| 9 | DATA casuser.RH_CIBLE; LENGTH EmpID $5 Dept $10; INPUT EmpID $ Dept $; DATALINES; |
| 10 | E01 IT |
| 11 | E02 Finance |
| 12 | E03 . |
| 13 | E05 Sales |
| 14 | ; RUN; |
| 1 | PROC CAS; |
| 2 | SIMPLE.compare / |
| 3 | TABLE={name='RH_SOURCE', groupBy={'EmpID', 'Dept'}}, |
| 4 | table2={name='RH_CIBLE', groupBy={'EmpID', 'Dept'}}, |
| 5 | includeMissing=true, |
| 6 | includeDuplicates={'CASOUT', 'CASOUT2'}, |
| 7 | casOut={name='ANOMALIES_SOURCE', replace=true}, |
| 8 | casOut2={name='ANOMALIES_CIBLE', replace=true}; |
| 9 | RUN; |
1. L'employé E03 (Dept manquant) doit être correctement apparié (pas d'erreur). 2. L'employé E01 (doublon dans Source) doit apparaître une fois dans 'ANOMALIES_SOURCE' car la cible n'en a qu'un seul, ou être géré selon la logique de fréquence. 3. E02 apparaîtra dans les deux tables d'anomalies car le département diffère (HR vs Finance).