Publicado el :

Ejemplos de introducción a SAS Studio

Este código también está disponible en: Deutsch English Français
En espera de validación
El script demuestra el uso de PROC PRINT para mostrar datos (completos o seleccionados) del conjunto de datos SASHELP.CARS. También utiliza PROC SQL para crear una nueva tabla (WORK.query) filtrando y ordenando los datos de SASHELP.CARS. PROC DATASETS se emplea para extraer los metadatos de esta nueva tabla en WORK.details, que luego se muestra con PROC PRINT. Se calculan estadísticas descriptivas sobre la variable 'Weight' del conjunto de datos SASHELP.CARS utilizando PROC MEANS. Finalmente, PROC SGPLOT se utiliza para generar un gráfico de barras que visualiza la población por región a partir de SASHELP.DEMOGRAPHICS, con opciones ODS Graphics para la salida.
Análisis de datos

Type : SASHELP


Los datos fuente primarios provienen de las bibliotecas SASHELP, incluyendo SASHELP.CARS y SASHELP.DEMOGRAPHICS. Se crean y utilizan tablas de trabajo intermedias (WORK.query, WORK.details) durante el script a partir de estos datos fuente.

1 Bloque de código
PROC PRINT
Explicación :
Muestra el conjunto de datos completo SASHELP.CARS en el log o en la salida predeterminada, proporcionando una vista rápida de los datos brutos.
¡Copiado!
1PROC PRINT DATA=sashelp.cars;
2RUN;
2 Bloque de código
PROC PRINT
Explicación :
Muestra una selección específica de variables (Make, Model, Type, etc.) del conjunto de datos SASHELP.CARS. La cláusula 'by Make' organiza la salida por fabricante, lo que permite agrupar las observaciones para una mejor legibilidad.
¡Copiado!
1PROC PRINT DATA=sashelp.cars;
2 BY Make;
3 var Make Model Type DriveTrain EngineSize Cylinders Horsepower MPG_City MPG_Highway;
4RUN;
3 Bloque de código
PROC SQL Data
Explicación :
Crea una nueva tabla SAS temporal llamada 'WORK.query' utilizando una consulta SQL. Esta consulta selecciona varias columnas del conjunto de datos SASHELP.CARS, filtra los automóviles con una potencia (Horsepower) mayor o igual a 400, y ordena los resultados por potencia descendente para identificar los vehículos más potentes.
¡Copiado!
1PROC SQL;
2CREATE TABLE WORK.query AS
3SELECT Make , Model , 'Type'n , Origin , DriveTrain , EngineSize , Cylinders , Horsepower , MPG_City , MPG_Highway , Weight , Wheelbase FROM SASHELP.CARS WHERE Horsepower >=400 ORDER BY Horsepower DESCENDING;
4RUN;
5QUIT;
4 Bloque de código
PROC DATASETS Data
Explicación :
Utiliza PROC DATASETS para generar un informe de contenido detallado (metadatos) del conjunto de datos 'WORK.query' creado previamente. El resultado se guarda en una nueva tabla SAS, 'WORK.details', en lugar de mostrarse directamente en el log. Las opciones NOLIST y NODETAILS suprimen las salidas del procedimiento para centrarse únicamente en la creación de la tabla de metadatos.
¡Copiado!
1 
2PROC DATASETS NOLIST NODETAILS;
3CONTENTS
4DATA=WORK.query OUT=WORK.details;
5RUN;
6 
5 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido de la tabla 'WORK.details', que contiene los metadatos (nombres de variables, tipos, longitudes, formatos, etc.) del conjunto de datos 'WORK.query'. Esto permite examinar la estructura de la tabla intermedia.
¡Copiado!
1PROC PRINT DATA=WORK.details;
2RUN;
6 Bloque de código
PROC MEANS
Explicación :
Calcula estadísticas descriptivas (media, desviación estándar, mínimo, máximo, número de observaciones) para la variable 'Weight' del conjunto de datos SASHELP.CARS. La opción 'chartype' se utiliza para el tipo de datos de la variable de análisis, y 'vardef=df' especifica que el divisor para la desviación estándar y la varianza debe basarse en los grados de libertad.
¡Copiado!
1 
2PROC MEANS
3DATA=SASHELP.CARS chartype mean std min max n vardef=df;
4var Weight;
5RUN;
6 
7 Bloque de código
PROC SGPLOT
Explicación :
Genera un gráfico de barras que visualiza la 'Population by Region' (Población por Región) a partir del conjunto de datos SASHELP.DEMOGRAPHICS. Las opciones ODS Graphics se restablecen y configuran primero. El gráfico de barras utiliza la variable 'region' para las categorías y 'pop' (población) como variable de respuesta, mostrando la media de la población por región. Se aplican atributos de relleno y estilo específicos para una mejor presentación. Finalmente, las opciones ODS Graphics y el título se restablecen después del procedimiento para evitar que afecten las salidas posteriores.
¡Copiado!
1ods graphics / reset imagemap;
2 
3/*--SGPLOT proc statement--*/
4PROC SGPLOT DATA=SASHELP.DEMOGRAPHICS;
5 /*--TITLE and FOOTNOTE--*/
6 title 'Population by Region';
7 
8 /*--Bar chart settings--*/
9 vbar region / response=pop fillattrs=(color=CX0a66f1) stat=Mean dataskin=Crisp
10 name='Bar';
11 
12 /*--Response Axis--*/
13 yaxis grid;
14RUN;
15 
16ods graphics / reset;
17title;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : Getting Started with SAS Studio; 10/28/2015; http://support.sas.com/training/tutorial/studio/get-started.html