dataPreprocess catTrans

Kreditrisiko-Bewertung mit Weight of Evidence (WOE)

Scénario de test & Cas d'usage

Geschäftskontext

Eine Bank entwickelt ein Kredit-Scoring-Modell. Um die Vorhersagekraft kategorialer Variablen wie 'Beruf' und 'Wohnstatus' in Bezug auf Kreditausfälle zu maximieren, sollen diese mittels Weight of Evidence (WOE) transformiert werden. Dies ist ein Standardverfahren im Risikomanagement.
Über das Set : dataPreprocess

Datenbereinigung, Imputation und Vorverarbeitung.

Entdecken Sie alle Aktionen von dataPreprocess
Datenaufbereitung

Erstellung eines Datensatzes 'kredit_daten' mit Kundeninformationen und einer binären Zielvariable (Ausfall).

Kopiert!
1 
2DATA casuser.kredit_daten;
3LENGTH beruf $20 wohnstatus $10;
4DO i=1 to 1000;
5IF rand('UNIFORM') < 0.3 THEN beruf='Angestellt';
6ELSE IF rand('UNIFORM') < 0.6 THEN beruf='Selbststaendig';
7ELSE beruf='Rentner';
8IF rand('UNIFORM') < 0.5 THEN wohnstatus='Miete';
9ELSE wohnstatus='Eigentum';
10ausfall = (rand('UNIFORM') < 0.1);
11OUTPUT;
12END;
13 
14RUN;
15 

Étapes de réalisation

1
Laden der Daten und Initialisierung der Umgebung.
Kopiert!
1PROC CAS;
2 SESSION casauto;
3 RUN;
2
Durchführung der WOE-Transformation. Die Methode 'WOE' wird verwendet, da es sich um eine überwachte Technik handelt, die das Ziel 'ausfall' berücksichtigt.
Kopiert!
1PROC CAS;
2 dataPreprocess.catTrans /
3 TABLE={name='kredit_daten', caslib='casuser'},
4 method='WOE',
5 inputs={{name='beruf'}, {name='wohnstatus'}},
6 targets={{name='ausfall'}},
7 events={'1'},
8 casOut={name='woe_ergebnisse', caslib='casuser', replace=true},
9 casOutBinDetails={name='woe_details', caslib='casuser', replace=true},
10 copyVars={'ausfall', 'beruf'};
11 RUN;

Erwartetes Ergebnis


Die Aktion erstellt erfolgreich die Tabelle 'woe_ergebnisse', in der die ursprünglichen Kategorien durch ihre WOE-Werte ersetzt wurden. Die Tabelle 'woe_details' enthält die Informationswerte (IV) für jede Variable, was die Bewertung der Variablenwichtigkeit ermöglicht.