Die Aktion `forestScore` bewertet eine Tabelle mithilfe eines zuvor trainierten Forest-Modells. Sie ermöglicht die Anwendung eines Random-Forest-Modells auf neue Daten, um Vorhersagen (Scoring) zu treffen. Die Aktion unterstützt verschiedene Optionen zur Steuerung der Ausgabe, wie z. B. die Berechnung von Fehlerraten, die Ausgabe von Wahrscheinlichkeiten bei Klassifikationsproblemen und die Behandlung fehlender Werte. Sie ist essentiell für den Einsatz von maschinellen Lernmodellen in der Produktion.
| Parameter | Beschreibung |
|---|---|
| modelTable | Gibt die Tabelle an, die das trainierte Forest-Modell enthält. Dies ist ein Pflichtparameter. |
| table | Gibt die Eingabetabelle an, die bewertet (gescort) werden soll. Dies ist ein Pflichtparameter. |
| casOut | Gibt die Tabelle an, in der die Bewertungsergebnisse gespeichert werden sollen. Wenn nicht angegeben, werden nur Fehlerraten berechnet. |
| assess | Wenn auf TRUE gesetzt, werden vorhergesagte Wahrscheinlichkeiten für die Ereignisebenen zur Ergebnistabelle hinzugefügt, nützlich für die `assess`-Aktion. |
| assessOneRow | Ähnlich wie `assess`, fügt jedoch alle Ereigniswahrscheinlichkeiten als separate Spalten mit dem Präfix `_DT_P_` hinzu. |
| copyVars | Liste der Variablen, die aus der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. |
| encodeName | Steuert die Benennung der Wahrscheinlichkeitsvariablen. Bei TRUE wird das Präfix `P_` anstelle von `_DT_P_` verwendet. |
| impute | Gibt an, ob beobachtete Werte für die Zielvariable als vorhergesagte Werte verwendet werden sollen, wenn sie nicht fehlen (Standard: FALSE). |
| includeMissing | Legt fest, ob Beobachtungen mit fehlenden Werten in den Modellvariablen beim Scoring berücksichtigt werden sollen (Standard: TRUE). |
| vote | Bestimmt die Abstimmungsstrategie für die Klassifikation. Werte: 'MAJORITY' (Mehrheitsentscheidung) oder 'PROB' (Durchschnittswahrscheinlichkeit). |
| nTree | Gibt die Anzahl der Bäume an, die für das Scoring verwendet werden sollen. |
| varIntImp | Fordert die Berechnung der Wichtigkeit von Variableninteraktionen an und gibt den maximalen Grad der Interaktion an (0-3). |
| treeVotes | Fügt der Ausgabetabelle Informationen über die Abstimmungen der einzelnen Bäume hinzu. |
| treeError | Berechnet den Fehler für jeden Baum im Forest, wenn auf TRUE gesetzt. |
Lädt den HMEQ-Datensatz und trainiert ein Forest-Modell, das anschließend für das Scoring verwendet wird.
| 1 | PROC CAS; |
| 2 | SESSION casauto; |
| 3 | /* Lade Daten */ |
| 4 | TABLE.loadTable RESULT=r STATUS=s / caslib="samples" path="hmeq.csv" casOut={name="hmeq", replace=true}; |
| 5 | |
| 6 | /* Trainiere das Modell */ |
| 7 | decisionTree.forestTrain RESULT=r STATUS=s / |
| 8 | TABLE={name="hmeq", where="BAD ne ."} |
| 9 | target="BAD" |
| 10 | inputs={"LOAN", "MORTDUE", "VALUE", "REASON", "JOB", "YOJ", "DEROG", "DELINQ", "CLAGE", "NINQ", "CLNO", "DEBTINC"} |
| 11 | nominals={"REASON", "JOB", "BAD"} |
| 12 | casOut={name="forest_model", replace=true}; |
| 13 | RUN; |
Bewertet die HMEQ-Tabelle mit dem zuvor trainierten Modell und speichert die Ergebnisse.
| 1 | PROC CAS; |
| 2 | decisionTree.forestScore / |
| 3 | TABLE={name="hmeq"} |
| 4 | modelTable={name="forest_model"} |
| 5 | casOut={name="hmeq_scored", replace=true}; |
| 6 | RUN; |
Führt ein Scoring durch, bei dem Wahrscheinlichkeiten berechnet, bestimmte Variablen kopiert und die Abstimmungsstrategie festgelegt werden.
| 1 | PROC CAS; |
| 2 | decisionTree.forestScore / |
| 3 | TABLE={name="hmeq"} |
| 4 | modelTable={name="forest_model"} |
| 5 | /* Speichere Ergebnisse in 'hmeq_detailed_score' */ |
| 6 | casOut={name="hmeq_detailed_score", replace=true} |
| 7 | /* Kopiere die ID-Variable oder wichtige Eingaben */ |
| 8 | copyVars={"LOAN", "REASON", "JOB"} |
| 9 | /* Berechne Wahrscheinlichkeiten für die Analyse */ |
| 10 | assess=true |
| 11 | assessOneRow=true |
| 12 | /* Verwende die Durchschnittswahrscheinlichkeit für die Entscheidung */ |
| 13 | vote="PROB" |
| 14 | /* Kodierung der Ausgabevariablennamen */ |
| 15 | encodeName=true; |
| 16 | RUN; |