mlTools crossValidate

Standard-Validierung eines Kreditrisikomodells (Entscheidungsbaum)

Scénario de test & Cas d'usage

Geschäftskontext

Eine Regionalbank möchte ein neues Kreditbewertungsmodell einführen, um Kreditausfälle vorherzusagen. Bevor das Modell produktiv gesetzt wird, muss die Stabilität des Entscheidungsbaums (Decision Tree) mittels einer 5-fachen Kreuzvalidierung überprüft werden, um Overfitting zu vermeiden.
Datenaufbereitung

Erstellung eines Datensatzes 'kredit_daten' mit Kundeninformationen wie Einkommen, Kreditbetrag und Zahlungshistorie.

Kopiert!
1 
2DATA casuser.kredit_daten;
3call streaminit(123);
4DO id = 1 to 1000;
5einkommen = rand('Normal', 50000, 10000);
6kredit_betrag = rand('Uniform', 1000, 20000);
7vergangene_ausfaelle = rand('Poisson', 0.5);
8IF (einkommen < 30000 and kredit_betrag > 10000) or vergangene_ausfaelle > 1 THEN ausfall = 1;
9ELSE ausfall = 0;
10OUTPUT;
11END;
12 
13RUN;
14 

Étapes de réalisation

1
Ausführung der 5-fachen Kreuzvalidierung mit einem Entscheidungsbaum.
Kopiert!
1 
2PROC CAS;
3mlTools.crossValidate / TABLE={name='kredit_daten'}, modelType='DECISIONTREE', kFolds=5, trainOptions={ target='ausfall', inputs={'einkommen', 'kredit_betrag', 'vergangene_ausfaelle'} };
4 
5RUN;
6 

Erwartetes Ergebnis


Die Aktion wird erfolgreich ausgeführt und liefert eine zusammenfassende Tabelle der Bewertungsmetriken (wie z.B. Fehlklassifikationsrate) für jeden der 5 Folds. Dies bestätigt die Basis-Funktionalität des Modells auf den simulierten Bankdaten.