Die Beispiele verwenden den Sashelp.JunkMail-Datensatz, der für die Ausführung der Prozeduren in eine temporäre CAS-Tabelle namens mycas.junkmail geladen wird.
1 Codeblock
PROC FOREST Data
Erklärung : Dieses Beispiel initialisiert eine CAS-Sitzung und lädt den 'JunkMail'-Datensatz von Sashelp in eine CAS-Tabelle namens 'mycas.junkmail'. Anschließend wird ein grundlegendes Zufallswaldmodell unter Verwendung der FOREST-Prozedur mit Standardparametern trainiert, abgesehen von einem Seed für die Reproduzierbarkeit. Die Anpassungsstatistiken des Modells werden gespeichert und angezeigt.
Kopiert!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest de base */
proc forest data=mycas.junkmail seed=54321;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
ods output FitStatistics=basic_fit_stats;
run;
/* Afficher les statistiques d'ajustement */
proc print data=basic_fit_stats;
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest de base */
9
PROC FORESTDATA=mycas.junkmail seed=54321;
10
INPUT Address Addresses All Bracket Business CS CapAvg CapLong
11
CapTotal Conference Credit DATA Direct Dollar Edu Email
12
Exclamation Font Free George HP HPL Internet Lab Labs
13
Mail Make Meeting Money Order Original Our Over PM Paren
14
Parts People Pound Project RE Receive Remove Semicolon
15
TABLE Technology Telnet Will You Your _000 _85 _415 _650
16
_857 _1999 _3D / level = interval;
17
target class /level=nominal;
18
ods OUTPUT FitStatistics=basic_fit_stats;
19
RUN;
20
21
/* Afficher les statistiques d'ajustement */
22
PROC PRINTDATA=basic_fit_stats;
23
RUN;
2 Codeblock
PROC FOREST
Erklärung : Dieses Beispiel erweitert den grundlegenden Anwendungsfall durch die Integration von Baumwachstumsoptionen (NODESIZE und MAXDEPTH) zur Steuerung der Baumkomplexität. Es verwendet auch die Kreuzvalidierung (CROSSVALIDATION CV=5), um die Modellleistung robuster zu bewerten. Die vorhergesagten Scores werden gespeichert und die ersten Beobachtungen angezeigt.
Kopiert!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest avec validation croisée et options d'arbre */
proc forest data=mycas.junkmail seed=67890;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
grow nodesize=5 maxdepth=10; /* Options courantes pour la croissance des arbres */
crossvalidation cv=5; /* Validation croisée à 5 plis */
output out=mycas.forest_cv_scores predicted_class;
ods output FitStatistics=cv_fit_stats;
run;
/* Afficher les premières observations des scores de validation croisée */
proc print data=mycas.forest_cv_scores (obs=10);
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest avec validation croisée et options d'arbre */
9
PROC FORESTDATA=mycas.junkmail seed=67890;
10
INPUT Address Addresses All Bracket Business CS CapAvg CapLong
11
CapTotal Conference Credit DATA Direct Dollar Edu Email
12
Exclamation Font Free George HP HPL Internet Lab Labs
13
Mail Make Meeting Money Order Original Our Over PM Paren
14
Parts People Pound Project RE Receive Remove Semicolon
15
TABLE Technology Telnet Will You Your _000 _85 _415 _650
16
_857 _1999 _3D / level = interval;
17
target class /level=nominal;
18
grow nodesize=5 maxdepth=10; /* Options courantes pour la croissance des arbres */
19
crossvalidation cv=5; /* Validation croisée à 5 plis */
/* Afficher les premières observations des scores de validation croisée */
25
PROC PRINTDATA=mycas.forest_cv_scores (obs=10);
26
RUN;
3 Codeblock
PROC FOREST
Erklärung : Dieses fortgeschrittene Beispiel verwendet die FOREST-Prozedur, um ein Modell zu trainieren und dabei eine Variablenauswahl basierend auf deren Bedeutung (SELECTION METHOD=VARIABLEIMPORTANCE) durchzuführen. Die IMPORTANCE-Anweisung wird hinzugefügt, um die Beiträge jeder Variable zum Modell anzuzeigen. Die vorhergesagten Scores werden gespeichert und die Variablenbedeutung wird in einer separaten Tabelle angezeigt.
Kopiert!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest avec sélection de variables et importance */
proc forest data=mycas.junkmail seed=98765;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
selection method=variableimportance; /* Sélection de variables basée sur l'importance */
importance; /* Demander l'affichage de l'importance des variables */
output out=mycas.forest_importance_scores predicted_class;
ods output FitStatistics=importance_fit_stats VariableImportance=var_importance_table;
run;
/* Afficher l'importance des variables */
proc print data=var_importance_table;
run;
/* Afficher les premières observations des scores */
proc print data=mycas.forest_importance_scores (obs=10);
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest avec sélection de variables et importance */
9
PROC FORESTDATA=mycas.junkmail seed=98765;
10
INPUT Address Addresses All Bracket Business CS CapAvg CapLong
11
CapTotal Conference Credit DATA Direct Dollar Edu Email
12
Exclamation Font Free George HP HPL Internet Lab Labs
13
Mail Make Meeting Money Order Original Our Over PM Paren
14
Parts People Pound Project RE Receive Remove Semicolon
15
TABLE Technology Telnet Will You Your _000 _85 _415 _650
16
_857 _1999 _3D / level = interval;
17
target class /level=nominal;
18
selection method=variableimportance; /* Sélection de variables basée sur l'importance */
19
importance; /* Demander l'affichage de l'importance des variables */
Erklärung : Dieses Beispiel, wie in der Dokumentation dargestellt, zeigt den vollständigen Prozess des Speicherns und Wiederverwendens eines Modells. Zuerst wird ein Modell auf 'mycas.junkmail' trainiert und mit der Option OUTMODEL= in 'mycas.forest_model' gespeichert. Anschließend wird dieses gespeicherte Modell über die Option INMODEL= geladen, um die 'neuen' Daten zu bewerten (in diesem Beispiel werden dieselben Daten zu Demonstrationszwecken verwendet). Die vorhergesagten Scores werden in 'mycas.score_later' gespeichert und die ersten Beobachtungen angezeigt, was die Fähigkeit zur Anwendung eines vorab trainierten Modells demonstriert.
Kopiert!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest et le sauvegarder (première exécution) */
proc forest data=mycas.junkmail outmodel=mycas.forest_model seed=12345;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
output out=mycas.score_at_runtime predicted_class;
run;
/* Utiliser le modèle sauvegardé pour scorer de nouvelles données (ici, les mêmes données pour démonstration) */
/* (Simule le scoring de 'nouvelles' données à un moment ultérieur ou sur un autre jeu de données) */
proc forest data=mycas.junkmail inmodel=mycas.forest_model;
output out=mycas.score_later predicted_class;
run;
/* Afficher les premières observations des données scorées */
proc print data=mycas.score_later (obs=10);
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest et le sauvegarder (première exécution) */
/* Afficher les premières observations des données scorées */
28
PROC PRINTDATA=mycas.score_later (obs=10);
29
RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.