mlTools crossValidate

Robustheitstest: Minimale Folds und detailliertes Logging (SVM)

Scénario de test & Cas d'usage

Geschäftskontext

Ein medizinisches Forschungsinstitut testet ein Support Vector Machine (SVM) Modell an einem sehr kleinen Datensatz seltener Krankheiten. Um die Reproduzierbarkeit für Audits sicherzustellen und jeden Schritt nachzuvollziehen, werden minimale Folds und das höchste Logging-Level gefordert.
Datenaufbereitung

Erstellung eines kleinen Datensatzes 'patienten_studie' mit wenigen Beobachtungen.

Kopiert!
1 
2DATA casuser.patienten_studie;
3INPUT patient_id alter blutwert marker diagnose $;
4DATALINES;
51 25 105.5 0.1 Negativ 2 30 110.2 0.4 Negativ 3 45 140.0 0.8 Positiv 4 50 135.5 0.7 Positiv 5 22 100.1 0.0 Negativ 6 60 160.3 0.9 Positiv ;
6 
7RUN;
8 

Étapes de réalisation

1
Ausführung mit minimaler Fold-Anzahl (2), fixem Seed und maximalem Log-Level.
Kopiert!
1 
2PROC CAS;
3mlTools.crossValidate / TABLE={name='patienten_studie'}, modelType='SVM', kFolds=2, seed=42, logLevel=3, trainOptions={ target='diagnose', inputs={'alter', 'blutwert', 'marker'} };
4 
5RUN;
6 

Erwartetes Ergebnis


Die Aktion läuft erfolgreich mit nur 2 Folds. Dank `logLevel=3` enthält das Protokoll detaillierte Informationen über die Initialisierung, die Aufteilung der Daten und den Abschluss jedes Folds. Der Seed garantiert exakt gleiche Ergebnisse bei Wiederholung.