decisionTree

forestTrain

Beschreibung

Trainiert ein Forest-Modell (Zufallswald). Diese Aktion erstellt ein Ensemble von Entscheidungsbäumen, um Vorhersagen für eine Zielvariable zu treffen. Sie unterstützt sowohl Klassifikations- als auch Regressionsaufgaben und bietet umfangreiche Optionen zur Steuerung des Trainingsprozesses, wie z. B. Bootstrapping, Variablenwichtigkeit und verschiedene Aufteilungskriterien. Erfordert eine SAS Visual Data Mining und Machine Learning Lizenz.

Einstellungen
ParameterBeschreibung
tableGibt die Einstellungen für die Eingabetabelle an, die die Trainingsdaten enthält.
targetGibt die Zielvariable für das Training an.
inputsGibt die Eingabevariablen an, die für die Analyse verwendet werden sollen.
nominalsGibt die nominalen Eingabevariablen an.
casOutGibt die Ausgabetabelle an, in der das Decision-Tree-Modell gespeichert wird.
nTreeGibt die Anzahl der zu erstellenden Bäume an (Standard: 50).
mGibt die Anzahl der Eingabevariablen an, die für die Aufteilung an einem Knoten zufällig ausgewählt werden.
bootstrapGibt den Anteil der Daten für das Bootstrap-Sample an (Standard: 0.632).
maxLevelGibt die maximale Tiefe der Bäume an (Standard: 6).
leafSizeGibt die minimale Anzahl von Beobachtungen in einem Blattknoten an (Standard: 5).
critGibt das Aufteilungskriterium für jeden Baumknoten an (z. B. GINI, GAIN, CHISQUARE).
varImpGibt an, ob Informationen zur Variablenwichtigkeit generiert werden sollen.
saveStateGibt die Tabelle an, um das generierte aStore-Modell zu speichern.
seedGibt den Startwert für den Zufallszahlengenerator an (Standard: 0, computerzeitbasiert).
Datenvorbereitung

Lädt den Beispieldatensatz 'cars' aus der Bibliothek 'sashelp' in die CAS-Bibliothek 'casuser'.

Kopiert!
1PROC CAS;
2 SESSION casauto;
3 DATA step / outputTable={name="cars", caslib="casuser", replace=true};
4 SET sashelp.cars;
5 RUN;
6QUIT;

Beispiele

Trainiert ein Forest-Modell zur Vorhersage der Herkunft ('Origin') basierend auf Preis, Leistung und Gewicht.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 decisionTree.forestTrain /
3 TABLE={name="cars", caslib="casuser"}
4 target="Origin"
5 inputs={"MSRP", "Horsepower", "Weight"}
6 casOut={name="simple_forest_model", replace=true};
7 RUN;
8QUIT;
Ergebnis :
Das Modell 'simple_forest_model' wird erstellt und kann für Scoring verwendet werden.

Trainiert einen Forest mit 100 Bäumen, maximaler Tiefe 10 und aktiviertem Bootstrapping. Berechnet die Variablenwichtigkeit und speichert das Modell als Analytic Store (aStore).

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 decisionTree.forestTrain /
3 TABLE={name="cars", caslib="casuser"}
4 target="Origin"
5 inputs={"MSRP", "Horsepower", "EngineSize", "Cylinders", "MPG_City", "Weight"}
6 nominals={"Origin", "Cylinders"}
7 nTree=100
8 maxLevel=10
9 leafSize=5
10 bootstrap=0.6
11 varImp=true
12 seed=12345
13 saveState={name="forest_astore", replace=true};
14 RUN;
15QUIT;
Ergebnis :
Ein detailliertes Forest-Modell wird trainiert. Eine Tabelle zur Variablenwichtigkeit wird ausgegeben, und das Modell wird in 'forest_astore' gespeichert.

FAQ

Was ist der Zweck der Aktion forestTrain?
Was spezifiziert der Parameter 'table'?
Wozu dient der Parameter 'casOut'?
Was legt der Parameter 'target' fest?
Was bewirkt der Parameter 'inputs'?
Was ist die Funktion des Parameters 'saveState'?
Was steuert der Parameter 'varImp'?
Welchen Standardwert hat der Parameter 'nTree'?
Was bewirkt der Parameter 'encodeName'?
Wofür wird der Parameter 'seed' verwendet?