Scénario de test & Cas d'usage
Nettoyage, imputation et préparation des données.
Découvrir toutes les actions de dataPreprocessSimulation d'un portefeuille de 5000 clients avec une variable cible binaire (Defaut_Paiement) et des variables explicatives catégorielles corrélées.
| 1 | |
| 2 | DATA casuser.credit_risk; |
| 3 | call streaminit(123); |
| 4 | LENGTH Profession $20 Type_Logement $15 Defaut_Paiement $1; |
| 5 | DO i = 1 to 5000; |
| 6 | u = rand('Uniform'); |
| 7 | /* Simulation Profession */ IF u < 0.3 THEN Profession = 'Fonctionnaire'; |
| 8 | ELSE IF u < 0.6 THEN Profession = 'Salarie_Prive'; |
| 9 | ELSE IF u < 0.8 THEN Profession = 'Independant'; |
| 10 | ELSE Profession = 'Retraite'; |
| 11 | /* Simulation Logement */ IF rand('Uniform') < 0.5 THEN Type_Logement = 'Proprietaire'; |
| 12 | ELSE Type_Logement = 'Locataire'; |
| 13 | /* Creation Target corrélée */ score_risque = 0; |
| 14 | IF Profession = 'Independant' THEN score_risque = score_risque + 0.4; |
| 15 | IF Type_Logement = 'Locataire' THEN score_risque = score_risque + 0.3; |
| 16 | IF rand('Uniform') + score_risque > 0.8 THEN Defaut_Paiement = '1'; |
| 17 | ELSE Defaut_Paiement = '0'; |
| 18 | OUTPUT; |
| 19 | END; |
| 20 | |
| 21 | RUN; |
| 22 |
| 1 | PROC CAS; |
| 2 | dataPreprocess.catTrans |
| 3 | TABLE={name='credit_risk'} |
| 4 | inputs={'Profession', 'Type_Logement'} |
| 5 | targets={{name='Defaut_Paiement'}} |
| 6 | events={'1'} |
| 7 | method='WOE' |
| 8 | evaluationStats=true |
| 9 | code={RESULT='scoring_code'} |
| 10 | casOut={name='credit_risk_woe', replace=true} |
| 11 | casOutBinDetails={name='woe_mapping', replace=true}; |
| 12 | RUN; |
| 1 | |
| 2 | PROC PRINT |
| 3 | DATA=casuser.woe_mapping; |
| 4 | where _IV_ > 0.02; |
| 5 | |
| 6 | RUN; |
| 7 |
L'action doit générer une table transformée où 'Profession' et 'Type_Logement' sont remplacées ou complétées par leurs valeurs WOE respectives. La table 'woe_mapping' doit montrer un IV significatif pour la profession 'Independant'. Le code SAS de scoring doit être disponible dans le résultat pour être appliqué en production.