Publicado el :

Análisis con PROC HPSPLIT

Este código también está disponible en: Deutsch English Français
El script utiliza el procedimiento HPSPLIT para crear un árbol de decisión. Modela el salario logarítmico ('logSalary') de los jugadores de béisbol en función de diversas variables explicativas del conjunto de datos SASHELP.BASEBALL. Las variables categóricas 'league' y 'division' se especifican. Se crea un conjunto de datos de salida 'hpsplout' para almacenar los resultados del modelado. La semilla aleatoria se fija para la reproducibilidad. Finalmente, las primeras 10 observaciones del conjunto de datos de salida se muestran a través de PROC PRINT para una inspección rápida.
Análisis de datos

Type : SASHELP


El script utiliza el conjunto de datos SASHELP.BASEBALL, que es un conjunto de datos de ejemplo estándar proporcionado con SAS, que contiene información sobre jugadores de béisbol, incluidas estadísticas de carrera y salario.

1 Bloque de código
Configuración ODS
Explicación :
Activa el sistema de destino de salida (ODS) para la generación de gráficos. Esta es una práctica común para asegurar que los procedimientos SAS que producen visualizaciones (como PROC HPSPLIT) generen sus salidas gráficas.
¡Copiado!
1ods graphics on;
2 Bloque de código
PROC HPSPLIT
Explicación :
Ejecuta el procedimiento HPSPLIT (High Performance SPLIT) para construir un árbol de decisión. Utiliza el conjunto de datos SASHELP.BASEBALL. 'seed=123' asegura la reproducibilidad de los resultados. La declaración 'class' identifica 'league' y 'division' como variables categóricas. La declaración 'model' especifica 'logSalary' como variable dependiente y lista las variables explicativas utilizadas para construir el árbol. La opción 'output out=hpsplout' crea un nuevo conjunto de datos 'hpsplout' que contiene los resultados de la predicción y otra información.
¡Copiado!
1PROC HPSPLIT DATA=sashelp.baseball seed=123;
2 class league division;
3 model logSalary = nAtBat nHits nHome nRuns nRBI nBB
4 yrMajor crAtBat crHits crHome crRuns crRbi
5 crBB league division nOuts nAssts nError;
6 OUTPUT out=hpsplout;
7RUN;
3 Bloque de código
PROC PRINT
Explicación :
Muestra las primeras 10 observaciones del conjunto de datos 'hpsplout'. Esto es útil para verificar el contenido y la estructura del conjunto de datos generado por PROC HPSPLIT, incluidas las variables de predicción añadidas.
¡Copiado!
1PROC PRINT DATA=hpsplout(obs=10); RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : S A S S A M P L E L I B R A R Y