Trainiert ein Forest-Modell (Zufallswald). Diese Aktion erstellt ein Ensemble von Entscheidungsbäumen, um Vorhersagen für eine Zielvariable zu treffen. Sie unterstützt sowohl Klassifikations- als auch Regressionsaufgaben und bietet umfangreiche Optionen zur Steuerung des Trainingsprozesses, wie z. B. Bootstrapping, Variablenwichtigkeit und verschiedene Aufteilungskriterien. Erfordert eine SAS Visual Data Mining und Machine Learning Lizenz.
| Parameter | Beschreibung |
|---|---|
| table | Gibt die Einstellungen für die Eingabetabelle an, die die Trainingsdaten enthält. |
| target | Gibt die Zielvariable für das Training an. |
| inputs | Gibt die Eingabevariablen an, die für die Analyse verwendet werden sollen. |
| nominals | Gibt die nominalen Eingabevariablen an. |
| casOut | Gibt die Ausgabetabelle an, in der das Decision-Tree-Modell gespeichert wird. |
| nTree | Gibt die Anzahl der zu erstellenden Bäume an (Standard: 50). |
| m | Gibt die Anzahl der Eingabevariablen an, die für die Aufteilung an einem Knoten zufällig ausgewählt werden. |
| bootstrap | Gibt den Anteil der Daten für das Bootstrap-Sample an (Standard: 0.632). |
| maxLevel | Gibt die maximale Tiefe der Bäume an (Standard: 6). |
| leafSize | Gibt die minimale Anzahl von Beobachtungen in einem Blattknoten an (Standard: 5). |
| crit | Gibt das Aufteilungskriterium für jeden Baumknoten an (z. B. GINI, GAIN, CHISQUARE). |
| varImp | Gibt an, ob Informationen zur Variablenwichtigkeit generiert werden sollen. |
| saveState | Gibt die Tabelle an, um das generierte aStore-Modell zu speichern. |
| seed | Gibt den Startwert für den Zufallszahlengenerator an (Standard: 0, computerzeitbasiert). |
Lädt den Beispieldatensatz 'cars' aus der Bibliothek 'sashelp' in die CAS-Bibliothek 'casuser'.
| 1 | PROC CAS; |
| 2 | SESSION casauto; |
| 3 | DATA step / outputTable={name="cars", caslib="casuser", replace=true}; |
| 4 | SET sashelp.cars; |
| 5 | RUN; |
| 6 | QUIT; |
Trainiert ein Forest-Modell zur Vorhersage der Herkunft ('Origin') basierend auf Preis, Leistung und Gewicht.
| 1 | PROC CAS; |
| 2 | decisionTree.forestTrain / |
| 3 | TABLE={name="cars", caslib="casuser"} |
| 4 | target="Origin" |
| 5 | inputs={"MSRP", "Horsepower", "Weight"} |
| 6 | casOut={name="simple_forest_model", replace=true}; |
| 7 | RUN; |
| 8 | QUIT; |
Trainiert einen Forest mit 100 Bäumen, maximaler Tiefe 10 und aktiviertem Bootstrapping. Berechnet die Variablenwichtigkeit und speichert das Modell als Analytic Store (aStore).
| 1 | PROC CAS; |
| 2 | decisionTree.forestTrain / |
| 3 | TABLE={name="cars", caslib="casuser"} |
| 4 | target="Origin" |
| 5 | inputs={"MSRP", "Horsepower", "EngineSize", "Cylinders", "MPG_City", "Weight"} |
| 6 | nominals={"Origin", "Cylinders"} |
| 7 | nTree=100 |
| 8 | maxLevel=10 |
| 9 | leafSize=5 |
| 10 | bootstrap=0.6 |
| 11 | varImp=true |
| 12 | seed=12345 |
| 13 | saveState={name="forest_astore", replace=true}; |
| 14 | RUN; |
| 15 | QUIT; |