Publicado el :

Análisis y Estadísticas de Datos Múltiples

Este código también está disponible en: Deutsch English Français
En espera de validación
El script está estructurado en varias secciones independientes. La primera sección crea un dataset 'scoredata' y deriva un subconjunto 'subsetscoredata' filtrando las observaciones según una condición en 'scorevalues'. La segunda sección inicializa un dataset 'demography' para luego realizar análisis de frecuencia sobre la variable 'Gender' con `PROC FREQ` y estadísticas descriptivas sobre 'Age', 'Weight', 'Height' con `PROC MEANS`. La sección principal crea un dataset 'biology' y aplica una serie de análisis estadísticos: cálculo de las medias para 'Age', 'Height', 'Weight', luego estadísticas descriptivas agrupadas por 'Sex', y después por 'Year' y 'Sex'. Se utiliza específicamente un `PROC MEANS` para guardar las estadísticas descriptivas calculadas (medias, desviaciones estándar, asimetrías, medianas) en un nuevo dataset llamado 'Stats_biology'. Finalmente, el script utiliza `PROC UNIVARIATE` para un análisis de distribución de 'Height' y `PROC MEANS` con la opción `maxdec=2` para formatear la salida de las estadísticas.
Análisis de datos

Type : CREACION_INTERNE


Todos los datasets ('scoredata', 'subsetscoredata', 'demography', 'biology', 'Stats_biology') se crean directamente dentro del script utilizando bloques `DATA STEP` con datos `datalines` integrados, o se derivan de estos datasets internos. No se hace referencia ni se requiere ninguna fuente de datos externa (archivos, bases de datos) para la ejecución del script.

1 Bloque de código
DATA STEP Data
Explicación :
Crea un dataset llamado 'scoredata' con dos variables, 'A' (carácter) y 'Scorevalues' (numérica), utilizando datos proporcionados directamente a través de `datalines`.
¡Copiado!
1DATA scoredata;
2INPUT A $ Scorevalues;
3DATALINES;
4P 77 P 76 P 74 P 72 P 78
5D 80 D 84 D 88 D 87 D 90
6RUN;
2 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido del dataset 'scoredata' en la salida SAS estándar.
¡Copiado!
1PROC PRINT DATA=scoredata;
3 Bloque de código
DATA STEP Data
Explicación :
Crea un nuevo dataset llamado 'subsetscoredata' a partir de 'scoredata', incluyendo solo las observaciones donde el valor de 'Scorevalues' es estrictamente superior a 78.
¡Copiado!
1DATA subsetscoredata;
2SET scoredata;
3IF scorevalues>78;
4RUN;
4 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido del dataset 'subsetscoredata' en la salida SAS estándar.
¡Copiado!
1PROC PRINT DATA=subsetscoredata;
5 Bloque de código
DATA STEP Data
Explicación :
Crea un dataset llamado 'demography' con variables 'Gender' (carácter), 'Age', 'Weight' y 'Height' (numéricas), utilizando datos proporcionados a través de `datalines`. La instrucción `title Demography;` define un título para las próximas salidas de procedimientos.
¡Copiado!
1*Q4;
2DATA demography;
3INPUT Gender $ Age Weight Height;
4DATALINES;
5M 50 68 155
6F 23 60 165
7M 65 72 180
8F 35 55 154
9M 15 35 158
10RUN;
11title Demography;
6 Bloque de código
PROC FREQ
Explicación :
Calcula y muestra la distribución de frecuencias para la variable 'Gender' del dataset 'demography', mostrando el número y el porcentaje de ocurrencias para cada categoría de género.
¡Copiado!
1PROC FREQ DATA=demography;
2TABLE Gender;
7 Bloque de código
PROC MEANS
Explicación :
Calcula las estadísticas descriptivas básicas (N, media, desviación estándar, mínimo, máximo) para las variables 'Age', 'Weight' y 'Height' del dataset 'demography'.
¡Copiado!
1PROC MEANS DATA=demography;
2Var Age Weight height;
8 Bloque de código
DATA STEP Data
Explicación :
Crea un dataset llamado 'biology' con variables 'Id' (numérica), 'sex' (carácter), 'Age', 'Year', 'Height' y 'Weight' (numéricas), utilizando datos proporcionados directamente a través de `datalines`.
¡Copiado!
1*------------------------------------;
2DATA biology;
3INPUT Id sex $ Age Year Height Weight;
4DATALINES;
57389 M 24 4 69.2 132.5
63945 F 19 2 58.5 112.8
74721 F 20 2 65.3 98.6
81835 F 24 4 62.8 102.5
99541 M 21 3 72.5 152.3
102957 M 22 3 67.3 145.8
112158 F 21 2 59.8 104.5
124296 F 25 3 62.5 132.5
134824 M 23 4 74.5 184.4
145736 M 22 3 69.1 149.5
158765 F 19 1 67.3 130.5
165734 F 18 1 64.3 110.2
17RUN;
9 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido completo del dataset 'biology' en la salida SAS estándar.
¡Copiado!
1PROC PRINT DATA=biology;
2RUN;
10 Bloque de código
PROC MEANS
Explicación :
Calcula las estadísticas descriptivas básicas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology'.
¡Copiado!
1*Q1) Obtain the means of Age,Height and Weight.;
2PROC MEANS DATA=biology;
3var Age Height Weight;
4RUN;
11 Bloque de código
PROC MEANS
Explicación :
Calcula las estadísticas descriptivas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology', agrupadas por cada categoría de la variable 'Sex'.
¡Copiado!
1*Q2) Obtain the Discptive statistics of Age Height and Weight by Gender wise.;
2PROC MEANS DATA=biology;
3var Age Height Weight;
4class Sex;
5RUN;
12 Bloque de código
PROC MEANS
Explicación :
Calcula las estadísticas descriptivas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology', agrupadas conjuntamente por las variables 'Year' y 'Sex'.
¡Copiado!
1*Q3) Obtain the Discptive statistics of Age Height and Weight by Gender and year wise.;
2PROC MEANS DATA=biology;
3var Age Height Weight;
4class year sex;
13 Bloque de código
PROC MEANS Data
Explicación :
Calcula las estadísticas descriptivas (medias, desviaciones estándar, asimetrías y medianas) para las variables 'Height' y 'Weight' del dataset 'biology', agrupadas por 'Year' y 'Sex'. Los resultados se almacenan en un nuevo dataset llamado 'Stats_biology'.
¡Copiado!
1*Q4) store Descriptive statistics in a specific variable.;
2PROC MEANS DATA=biology;
3class year sex;
4OUTPUT out=Stats_biology mean=av_height av_weight std=sd_height sd_weight skewness=sk_height sk_weight median=md_height md_weight;
14 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido del dataset 'Stats_biology', que contiene las estadísticas descriptivas calculadas y almacenadas por la `PROC MEANS` anterior.
¡Copiado!
1PROC PRINT DATA=Stats_biology;
2RUN;
15 Bloque de código
PROC UNIVARIATE
Explicación :
Genera estadísticas univariadas detalladas, incluyendo momentos, cuantiles, pruebas de normalidad y gráficos (si están activados), para la variable 'Height' del dataset 'biology', con el fin de examinar su distribución.
¡Copiado!
1*Q5) Use univariate command to check the distribution of data.;
2PROC UNIVARIATE DATA=biology;
3var Height;
4RUN;
16 Bloque de código
PROC MEANS
Explicación :
Calcula las estadísticas descriptivas básicas para todas las variables numéricas del dataset 'biology', formateando las salidas numéricas para mostrar un máximo de dos decimales gracias a la opción `maxdec=2`.
¡Copiado!
1*Q6) Use
2proc mean command and get the output upto two decimel;
3PROC MEANS
4DATA=biology maxdec=2;
5RUN;
6 
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.