decisionTree

forestCode

Beschreibung

Generiert DATA Step Scoring-Code aus einem Forest-Modell. Diese Aktion ermöglicht es, ein trainiertes Forest-Modell in tragbaren SAS-Code zu exportieren, der für das Scoring neuer Daten außerhalb der CAS-Umgebung verwendet werden kann.

Einstellungen
ParameterBeschreibung
modelTableGibt die Tabelle an, die das trainierte Forest-Modell enthält. Dies ist ein erforderlicher Parameter.
codeFordert die Generierung von SAS Scoring-Code an. Der Parameter 'casOut' innerhalb dieser Option spezifiziert die Ausgabetabelle für den Code.
encodeNameGibt an, ob die Namen der vorhergesagten Wahrscheinlichkeiten kodiert werden sollen (z. B. P_ anstelle von _DT_P_). Standard ist FALSE.
nTreeGibt die Anzahl der Bäume an, die für das Scoring verwendet werden sollen. Wenn nicht angegeben, werden alle Bäume verwendet.
voteLegt die Abstimmungsstrategie fest. 'MAJORITY' verwendet die Mehrheitsentscheidung, 'PROB' verwendet die Durchschnittswahrscheinlichkeit. Standard ist 'MAJORITY'.
Vorbereitung der Modelldaten

Lädt den HMEQ-Datensatz und trainiert ein Forest-Modell, das anschließend für die Code-Generierung verwendet wird.

Kopiert!
1 
2PROC CAS;
3 
4SESSION casauto;
5TABLE.loadTable / caslib="samples" path="hmeq.csv" casout="hmeq";
6decisionTree.forestTrain / TABLE={name="hmeq", where="BAD ne ."} target="BAD" inputs={"LOAN", "MORTDUE", "VALUE", "REASON", "JOB", "YOJ", "DEROG", "DELINQ", "CLAGE", "NINQ", "CLNO", "DEBTINC"} nominals={"REASON", "JOB", "BAD"} casOut={name="forest_model", replace=true};
7 
8RUN;
9 

Beispiele

Erstellt den SAS DATA Step Code aus dem trainierten Modell 'forest_model' und speichert ihn in der Tabelle 'score_code'.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3decisionTree.forestCode / modelTable={name="forest_model"} code={casOut={name="score_code", replace=true}};
4 
5RUN;
6 
Ergebnis :
Eine Tabelle 'score_code' wird erstellt, die den vollständigen SAS-Code enthält, um das Modell auf neue Daten anzuwenden.

Generiert Scoring-Code unter Verwendung einer Wahrscheinlichkeitsabstimmung (PROB), kodierten Variablennamen und einer Beschränkung auf die ersten 50 Bäume.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3decisionTree.forestCode / modelTable={name="forest_model"} code={casOut={name="score_code_custom", replace=true}, comment=true} encodeName=true nTree=50 vote="PROB";
4TABLE.fetch / TABLE={name="score_code_custom"};
5 
6RUN;
7 
Ergebnis :
Die Tabelle 'score_code_custom' enthält kommentierten SAS-Code, der die Wahrscheinlichkeiten (P_*) berechnet und nur 50 Bäume des Modells berücksichtigt.

FAQ

Was ist der Hauptzweck der Aktion forestCode?
Welcher Parameter ist erforderlich, um die Tabelle anzugeben, die das Modell enthält?
Wie kann man die Anzahl der Bäume steuern, die beim Scoring verwendet werden?
Welche Optionen gibt es für den Parameter 'vote' und was ist der Standardwert?
Was bewirkt der Parameter 'encodeName'?
Wozu dient der Parameter 'code'?