Das Skript verwendet die HPSPLIT-Prozedur, um einen Entscheidungsbaum zu erstellen. Es modelliert das logarithmische Gehalt ('logSalary') von Baseballspielern basierend auf verschiedenen erklärenden Variablen aus dem SASHELP.BASEBALL-Datensatz. Die kategorialen Variablen 'league' und 'division' werden spezifiziert. Ein Ausgabedatensatz 'hpsplout' wird erstellt, um die Modellergebnisse zu speichern. Der Zufalls-Seed wird für die Reproduzierbarkeit festgelegt. Schließlich werden die ersten 10 Beobachtungen des Ausgabedatensatzes über PROC PRINT zur schnellen Überprüfung angezeigt.
Datenanalyse
Type : SASHELP
Das Skript verwendet den SASHELP.BASEBALL-Datensatz, einen Standard-Beispieldatensatz, der mit SAS geliefert wird und Informationen über Baseballspieler enthält, einschließlich Karrierestatistiken und Gehalt.
1 Codeblock
ODS-Konfiguration
Erklärung : Aktiviert das Output Delivery System (ODS) für die Generierung von Grafiken. Dies ist eine gängige Praxis, um sicherzustellen, dass SAS-Prozeduren, die Visualisierungen (wie PROC HPSPLIT) erzeugen, ihre grafischen Ausgaben generieren.
Kopiert!
ods graphics on;
1
ods graphics on;
2 Codeblock
PROC HPSPLIT
Erklärung : Führt die HPSPLIT-Prozedur (High Performance SPLIT) aus, um einen Entscheidungsbaum zu erstellen. Es wird der Datensatz SASHELP.BASEBALL verwendet. 'seed=123' gewährleistet die Reproduzierbarkeit der Ergebnisse. Die 'class'-Anweisung identifiziert 'league' und 'division' als kategoriale Variablen. Die 'model'-Anweisung spezifiziert 'logSalary' als abhängige Variable und listet die erklärenden Variablen auf, die zum Aufbau des Baums verwendet werden. Die Option 'output out=hpsplout' erstellt einen neuen Datensatz 'hpsplout', der die Vorhersageergebnisse und weitere Informationen enthält.
Kopiert!
proc hpsplit data=sashelp.baseball seed=123;
class league division;
model logSalary = nAtBat nHits nHome nRuns nRBI nBB
yrMajor crAtBat crHits crHome crRuns crRbi
crBB league division nOuts nAssts nError;
output out=hpsplout;
run;
1
PROC HPSPLITDATA=sashelp.baseball seed=123;
2
class league division;
3
model logSalary = nAtBat nHits nHome nRuns nRBI nBB
4
yrMajor crAtBat crHits crHome crRuns crRbi
5
crBB league division nOuts nAssts nError;
6
OUTPUT out=hpsplout;
7
RUN;
3 Codeblock
PROC PRINT
Erklärung : Zeigt die ersten 10 Beobachtungen des Datensatzes 'hpsplout' an. Dies ist nützlich, um den Inhalt und die Struktur des von PROC HPSPLIT erzeugten Datensatzes zu überprüfen, insbesondere die hinzugefügten Vorhersagevariablen.
Kopiert!
proc print data=hpsplout(obs=10); run;
1
PROC PRINTDATA=hpsplout(obs=10); RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.