Los ejemplos utilizan el conjunto de datos Sashelp.JunkMail, que se carga en una tabla CAS temporal llamada mycas.junkmail para la ejecución de los procedimientos.
1 Bloque de código
PROC FOREST Data
Explicación : Este ejemplo inicializa una sesión CAS y carga el conjunto de datos 'JunkMail' de Sashelp en una tabla CAS llamada 'mycas.junkmail'. Luego entrena un modelo de bosque aleatorio básico usando el procedimiento FOREST con los parámetros predeterminados, excepto una semilla para la reproducibilidad. Las estadísticas de ajuste del modelo se guardan y se muestran.
¡Copiado!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest de base */
proc forest data=mycas.junkmail seed=54321;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
ods output FitStatistics=basic_fit_stats;
run;
/* Afficher les statistiques d'ajustement */
proc print data=basic_fit_stats;
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest de base */
9
PROC FORESTDATA=mycas.junkmail seed=54321;
10
INPUT Address Addresses All Bracket Business CS CapAvg CapLong
11
CapTotal Conference Credit DATA Direct Dollar Edu Email
12
Exclamation Font Free George HP HPL Internet Lab Labs
13
Mail Make Meeting Money Order Original Our Over PM Paren
14
Parts People Pound Project RE Receive Remove Semicolon
15
TABLE Technology Telnet Will You Your _000 _85 _415 _650
16
_857 _1999 _3D / level = interval;
17
target class /level=nominal;
18
ods OUTPUT FitStatistics=basic_fit_stats;
19
RUN;
20
21
/* Afficher les statistiques d'ajustement */
22
PROC PRINTDATA=basic_fit_stats;
23
RUN;
2 Bloque de código
PROC FOREST
Explicación : Este ejemplo amplía el caso de uso básico integrando opciones de crecimiento de árboles (NODESIZE y MAXDEPTH) para controlar la complejidad de los árboles. También utiliza la validación cruzada (CROSSVALIDATION CV=5) para evaluar el rendimiento del modelo de manera más robusta. Las puntuaciones predichas se guardan y se muestran las primeras observaciones.
¡Copiado!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest avec validation croisée et options d'arbre */
proc forest data=mycas.junkmail seed=67890;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
grow nodesize=5 maxdepth=10; /* Options courantes pour la croissance des arbres */
crossvalidation cv=5; /* Validation croisée à 5 plis */
output out=mycas.forest_cv_scores predicted_class;
ods output FitStatistics=cv_fit_stats;
run;
/* Afficher les premières observations des scores de validation croisée */
proc print data=mycas.forest_cv_scores (obs=10);
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest avec validation croisée et options d'arbre */
9
PROC FORESTDATA=mycas.junkmail seed=67890;
10
INPUT Address Addresses All Bracket Business CS CapAvg CapLong
11
CapTotal Conference Credit DATA Direct Dollar Edu Email
12
Exclamation Font Free George HP HPL Internet Lab Labs
13
Mail Make Meeting Money Order Original Our Over PM Paren
14
Parts People Pound Project RE Receive Remove Semicolon
15
TABLE Technology Telnet Will You Your _000 _85 _415 _650
16
_857 _1999 _3D / level = interval;
17
target class /level=nominal;
18
grow nodesize=5 maxdepth=10; /* Options courantes pour la croissance des arbres */
19
crossvalidation cv=5; /* Validation croisée à 5 plis */
/* Afficher les premières observations des scores de validation croisée */
25
PROC PRINTDATA=mycas.forest_cv_scores (obs=10);
26
RUN;
3 Bloque de código
PROC FOREST
Explicación : Este ejemplo avanzado utiliza el procedimiento FOREST para entrenar un modelo mientras realiza una selección de variables basada en su importancia (SELECTION METHOD=VARIABLEIMPORTANCE). Se añade la instrucción IMPORTANCE para mostrar las contribuciones de cada variable al modelo. Las puntuaciones predichas se guardan y la importancia de las variables se muestra en una tabla separada.
¡Copiado!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest avec sélection de variables et importance */
proc forest data=mycas.junkmail seed=98765;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
selection method=variableimportance; /* Sélection de variables basée sur l'importance */
importance; /* Demander l'affichage de l'importance des variables */
output out=mycas.forest_importance_scores predicted_class;
ods output FitStatistics=importance_fit_stats VariableImportance=var_importance_table;
run;
/* Afficher l'importance des variables */
proc print data=var_importance_table;
run;
/* Afficher les premières observations des scores */
proc print data=mycas.forest_importance_scores (obs=10);
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest avec sélection de variables et importance */
9
PROC FORESTDATA=mycas.junkmail seed=98765;
10
INPUT Address Addresses All Bracket Business CS CapAvg CapLong
11
CapTotal Conference Credit DATA Direct Dollar Edu Email
12
Exclamation Font Free George HP HPL Internet Lab Labs
13
Mail Make Meeting Money Order Original Our Over PM Paren
14
Parts People Pound Project RE Receive Remove Semicolon
15
TABLE Technology Telnet Will You Your _000 _85 _415 _650
16
_857 _1999 _3D / level = interval;
17
target class /level=nominal;
18
selection method=variableimportance; /* Sélection de variables basée sur l'importance */
19
importance; /* Demander l'affichage de l'importance des variables */
Explicación : Este ejemplo, tal como se presenta en la documentación, muestra el proceso completo de guardar y reutilizar un modelo. Primero, se entrena un modelo en 'mycas.junkmail' y se guarda usando la opción OUTMODEL= en 'mycas.forest_model'. Luego, este modelo guardado se carga a través de la opción INMODEL= para puntuar los 'nuevos' datos (en este ejemplo, se utilizan los mismos datos con fines de demostración). Las puntuaciones predichas se guardan en 'mycas.score_later' y se muestran las primeras observaciones, ilustrando la capacidad de aplicar un modelo preentrenado.
¡Copiado!
caslib _all_ assign;
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
data mycas.junkmail;
set sashelp.junkmail;
run;
/* Entraîner un modèle Forest et le sauvegarder (première exécution) */
proc forest data=mycas.junkmail outmodel=mycas.forest_model seed=12345;
input Address Addresses All Bracket Business CS CapAvg CapLong
CapTotal Conference Credit Data Direct Dollar Edu Email
Exclamation Font Free George HP HPL Internet Lab Labs
Mail Make Meeting Money Order Original Our Over PM Paren
Parts People Pound Project RE Receive Remove Semicolon
Table Technology Telnet Will You Your _000 _85 _415 _650
_857 _1999 _3D / level = interval;
target class /level=nominal;
output out=mycas.score_at_runtime predicted_class;
run;
/* Utiliser le modèle sauvegardé pour scorer de nouvelles données (ici, les mêmes données pour démonstration) */
/* (Simule le scoring de 'nouvelles' données à un moment ultérieur ou sur un autre jeu de données) */
proc forest data=mycas.junkmail inmodel=mycas.forest_model;
output out=mycas.score_later predicted_class;
run;
/* Afficher les premières observations des données scorées */
proc print data=mycas.score_later (obs=10);
run;
1
caslib _all_ assign;
2
3
/* Charger le jeu de données Sashelp.JunkMail dans une table CAS temporaire */
4
DATA mycas.junkmail;
5
SET sashelp.junkmail;
6
RUN;
7
8
/* Entraîner un modèle Forest et le sauvegarder (première exécution) */
/* Afficher les premières observations des données scorées */
28
PROC PRINTDATA=mycas.score_later (obs=10);
29
RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute Inc. en los EE. UU. y otros países. ® indica registro en los EE. UU. WeAreCAS es un sitio comunitario independiente y no está afiliado a SAS Institute Inc.
Este sitio utiliza cookies técnicas y analíticas para mejorar su experiencia.
Saber más.