Das Skript initialisiert eine CAS-Sitzung, lädt den Datensatz 'sashelp.baseball' in den CAS-Speicher unter der CASLIB 'casuser' und lädt dann das Action-Set 'decisionTree'. Anschließend wird die Aktion 'gbtreeTrain' verwendet, um ein Gradient-Boosting-Modell zu erstellen. Das Modell ist mit verschiedenen Optionen wie der POISSON-Verteilung, frühzeitigem Stoppen basierend auf 'LOGLOSS' und der Variablenbedeutung konfiguriert. Das trainierte Modell wird als CAS-Tabelle 'GRADBOOST3' gespeichert.
Datenanalyse
Type : SASHELP
Die Quelldaten stammen aus dem integrierten SAS-Datensatz 'sashelp.baseball', der dann in den CAS-Speicher unter der CASLIB 'casuser' geladen und verarbeitet wird.
1 Codeblock
DATA STEP Data
Erklärung : Dieser Codeblock initialisiert eine CAS-Sitzung und stellt alle CASLIBs zur Verfügung. Anschließend wird ein DATA STEP verwendet, um den Datensatz 'sashelp.baseball' in den CAS-Speicher unter der CASLIB 'casuser' zu laden, wodurch eine Arbeitskopie der Tabelle 'baseball' im CAS-Speicher erstellt wird.
Kopiert!
cas;
caslib _all_ assign;
data casuser.baseball;
set sashelp.baseball;
run;
1
cas;
2
caslib _all_ assign;
3
4
DATA casuser.baseball;
5
SET sashelp.baseball;
6
RUN;
2 Codeblock
PROC CAS
Erklärung : Dieser Block verwendet PROC CAS, um das Action-Set 'decisionTree' zu laden. Dieses Action-Set stellt die erforderlichen Aktionen zum Erstellen und Trainieren von Entscheidungsbaummodellen bereit, einschließlich der Gradient-Boosting-Aktion, die später verwendet wird.
Kopiert!
proc cas;
loadactionset 'decisionTree';
quit;
1
PROC CAS;
2
LOADACTIONSET'decisionTree';
3
QUIT;
3 Codeblock
PROC CAS Data
Erklärung : Dieser Block konfiguriert die Standard-CASLIB auf 'casuser' und verwendet dann die Aktion 'gbtreeTrain' aus dem Action-Set 'decisionTree' über PROC CAS. Diese Aktion trainiert ein Gradient-Boosting-Modell auf der Tabelle 'baseball' (casuser.baseball) und zielt auf die Variable 'logSalary' ab. Es wird eine Liste numerischer und nominaler Eingabevariablen angegeben, eine POISSON-Verteilung verwendet und Optionen für frühzeitiges Stoppen (basierend auf LOGLOSS), Namenskodierung, gierige Auswahl, Umgang mit fehlenden Werten, Lasso-Regularisierung, Blattgröße, Lernrate und Berechnung der Variablenbedeutung enthalten. Das trainierte Modell wird in einer neuen CAS-Tabelle namens 'GRADBOOST3' gespeichert.
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.