decisionTree

forestTrain

Beschreibung

Trainiert ein Forest-Modell (Zufallswald). Diese Aktion erstellt ein Ensemble von Entscheidungsbäumen, um Vorhersagen für eine Zielvariable zu treffen. Sie unterstützt sowohl Klassifikations- als auch Regressionsaufgaben und bietet umfangreiche Optionen zur Steuerung des Trainingsprozesses, wie z. B. Bootstrapping, Variablenwichtigkeit und verschiedene Aufteilungskriterien. Erfordert eine SAS Visual Data Mining und Machine Learning Lizenz.

Einstellungen
ParameterBeschreibung
table Gibt die Einstellungen für die Eingabetabelle an, die die Trainingsdaten enthält.
target Gibt die Zielvariable für das Training an.
inputs Gibt die Eingabevariablen an, die für die Analyse verwendet werden sollen.
nominals Gibt die nominalen Eingabevariablen an.
casOut Gibt die Ausgabetabelle an, in der das Decision-Tree-Modell gespeichert wird.
nTree Gibt die Anzahl der zu erstellenden Bäume an (Standard: 50).
m Gibt die Anzahl der Eingabevariablen an, die für die Aufteilung an einem Knoten zufällig ausgewählt werden.
bootstrap Gibt den Anteil der Daten für das Bootstrap-Sample an (Standard: 0.632).
maxLevel Gibt die maximale Tiefe der Bäume an (Standard: 6).
leafSize Gibt die minimale Anzahl von Beobachtungen in einem Blattknoten an (Standard: 5).
crit Gibt das Aufteilungskriterium für jeden Baumknoten an (z. B. GINI, GAIN, CHISQUARE).
varImp Gibt an, ob Informationen zur Variablenwichtigkeit generiert werden sollen.
saveState Gibt die Tabelle an, um das generierte aStore-Modell zu speichern.
seed Gibt den Startwert für den Zufallszahlengenerator an (Standard: 0, computerzeitbasiert).
Datenvorbereitung

Lädt den Beispieldatensatz 'cars' aus der Bibliothek 'sashelp' in die CAS-Bibliothek 'casuser'.

Kopiert!
1PROC CAS;
2 SESSION casauto;
3 DATA step / outputTable={name="cars", caslib="casuser", replace=true};
4 SET sashelp.cars;
5 RUN;
6QUIT;

Beispiele

Trainiert ein Forest-Modell zur Vorhersage der Herkunft ('Origin') basierend auf Preis, Leistung und Gewicht.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 decisionTree.forestTrain /
3 TABLE={name="cars", caslib="casuser"}
4 target="Origin"
5 inputs={"MSRP", "Horsepower", "Weight"}
6 casOut={name="simple_forest_model", replace=true};
7 RUN;
8QUIT;
Ergebnis :
Das Modell 'simple_forest_model' wird erstellt und kann für Scoring verwendet werden.

Trainiert einen Forest mit 100 Bäumen, maximaler Tiefe 10 und aktiviertem Bootstrapping. Berechnet die Variablenwichtigkeit und speichert das Modell als Analytic Store (aStore).

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 decisionTree.forestTrain /
3 TABLE={name="cars", caslib="casuser"}
4 target="Origin"
5 inputs={"MSRP", "Horsepower", "EngineSize", "Cylinders", "MPG_City", "Weight"}
6 nominals={"Origin", "Cylinders"}
7 nTree=100
8 maxLevel=10
9 leafSize=5
10 bootstrap=0.6
11 varImp=true
12 seed=12345
13 saveState={name="forest_astore", replace=true};
14 RUN;
15QUIT;
Ergebnis :
Ein detailliertes Forest-Modell wird trainiert. Eine Tabelle zur Variablenwichtigkeit wird ausgegeben, und das Modell wird in 'forest_astore' gespeichert.

FAQ

Was ist der Zweck der Aktion forestTrain?
Was spezifiziert der Parameter 'table'?
Wozu dient der Parameter 'casOut'?
Was legt der Parameter 'target' fest?
Was bewirkt der Parameter 'inputs'?
Was ist die Funktion des Parameters 'saveState'?
Was steuert der Parameter 'varImp'?
Welchen Standardwert hat der Parameter 'nTree'?
Was bewirkt der Parameter 'encodeName'?
Wofür wird der Parameter 'seed' verwendet?