Análisis y Estadísticas de Datos Múltiples

El script está estructurado en varias secciones independientes. La primera sección crea un dataset 'scoredata' y deriva un subconjunto 'subsetscoredata' filtrando las observaciones según una condición en 'scorevalues'. La segunda sección inicializa un dataset 'demography' para luego realizar análisis de frecuencia sobre la variable 'Gender' con `PROC FREQ` y estadísticas descriptivas sobre 'Age', 'Weight', 'Height' con `PROC MEANS`. La sección principal crea un dataset 'biology' y aplica una serie de análisis estadísticos: cálculo de las medias para 'Age', 'Height', 'Weight', luego estadísticas descriptivas agrupadas por 'Sex', y después por 'Year' y 'Sex'. Se utiliza específicamente un `PROC MEANS` para guardar las estadísticas descriptivas calculadas (medias, desviaciones estándar, asimetrías, medianas) en un nuevo dataset llamado 'Stats_biology'. Finalmente, el script utiliza `PROC UNIVARIATE` para un análisis de distribución de 'Height' y `PROC MEANS` con la opción `maxdec=2` para formatear la salida de las estadísticas.

Análisis de datos

Type : CREACION_INTERNE

Todos los datasets ('scoredata', 'subsetscoredata', 'demography', 'biology', 'Stats_biology') se crean directamente dentro del script utilizando bloques `DATA STEP` con datos `datalines` integrados, o se derivan de estos datasets internos. No se hace referencia ni se requiere ninguna fuente de datos externa (archivos, bases de datos) para la ejecución del script.

1 Bloque de código

DATA STEP Data

Explicación :
Crea un dataset llamado 'scoredata' con dos variables, 'A' (carácter) y 'Scorevalues' (numérica), utilizando datos proporcionados directamente a través de `datalines`.

¡Copiado!

1	DATA scoredata;
2	INPUT A $ Scorevalues;
3	DATALINES;
4	P 77 P 76 P 74 P 72 P 78
5	D 80 D 84 D 88 D 87 D 90
6	RUN;

2 Bloque de código

PROC PRINT

Explicación :
Muestra el contenido del dataset 'scoredata' en la salida SAS estándar.

¡Copiado!

1	PROC PRINT DATA=scoredata;

3 Bloque de código

DATA STEP Data

Explicación :
Crea un nuevo dataset llamado 'subsetscoredata' a partir de 'scoredata', incluyendo solo las observaciones donde el valor de 'Scorevalues' es estrictamente superior a 78.

¡Copiado!

1	DATA subsetscoredata;
2	SET scoredata;
3	IF scorevalues>78;
4	RUN;

4 Bloque de código

PROC PRINT

Explicación :
Muestra el contenido del dataset 'subsetscoredata' en la salida SAS estándar.

¡Copiado!

1	PROC PRINT DATA=subsetscoredata;

5 Bloque de código

DATA STEP Data

Explicación :
Crea un dataset llamado 'demography' con variables 'Gender' (carácter), 'Age', 'Weight' y 'Height' (numéricas), utilizando datos proporcionados a través de `datalines`. La instrucción `title Demography;` define un título para las próximas salidas de procedimientos.

¡Copiado!

1	*Q4;
2	DATA demography;
3	INPUT Gender $ Age Weight Height;
4	DATALINES;
5	M 50 68 155
6	F 23 60 165
7	M 65 72 180
8	F 35 55 154
9	M 15 35 158
10	RUN;
11	title Demography;

6 Bloque de código

PROC FREQ

Explicación :
Calcula y muestra la distribución de frecuencias para la variable 'Gender' del dataset 'demography', mostrando el número y el porcentaje de ocurrencias para cada categoría de género.

¡Copiado!

1	PROC FREQ DATA=demography;
2	TABLE Gender;

7 Bloque de código

PROC MEANS

Explicación :
Calcula las estadísticas descriptivas básicas (N, media, desviación estándar, mínimo, máximo) para las variables 'Age', 'Weight' y 'Height' del dataset 'demography'.

¡Copiado!

1	PROC MEANS DATA=demography;
2	Var Age Weight height;

8 Bloque de código

DATA STEP Data

Explicación :
Crea un dataset llamado 'biology' con variables 'Id' (numérica), 'sex' (carácter), 'Age', 'Year', 'Height' y 'Weight' (numéricas), utilizando datos proporcionados directamente a través de `datalines`.

¡Copiado!

1	*------------------------------------;
2	DATA biology;
3	INPUT Id sex $ Age Year Height Weight;
4	DATALINES;
5	7389 M 24 4 69.2 132.5
6	3945 F 19 2 58.5 112.8
7	4721 F 20 2 65.3 98.6
8	1835 F 24 4 62.8 102.5
9	9541 M 21 3 72.5 152.3
10	2957 M 22 3 67.3 145.8
11	2158 F 21 2 59.8 104.5
12	4296 F 25 3 62.5 132.5
13	4824 M 23 4 74.5 184.4
14	5736 M 22 3 69.1 149.5
15	8765 F 19 1 67.3 130.5
16	5734 F 18 1 64.3 110.2
17	RUN;

9 Bloque de código

PROC PRINT

Explicación :
Muestra el contenido completo del dataset 'biology' en la salida SAS estándar.

¡Copiado!

1	PROC PRINT DATA=biology;
2	RUN;

10 Bloque de código

PROC MEANS

Explicación :
Calcula las estadísticas descriptivas básicas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology'.

¡Copiado!

1	*Q1) Obtain the means of Age,Height and Weight.;
2	PROC MEANS DATA=biology;
3	var Age Height Weight;
4	RUN;

11 Bloque de código

PROC MEANS

Explicación :
Calcula las estadísticas descriptivas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology', agrupadas por cada categoría de la variable 'Sex'.

¡Copiado!

1	*Q2) Obtain the Discptive statistics of Age Height and Weight by Gender wise.;
2	PROC MEANS DATA=biology;
3	var Age Height Weight;
4	class Sex;
5	RUN;

12 Bloque de código

PROC MEANS

Explicación :
Calcula las estadísticas descriptivas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology', agrupadas conjuntamente por las variables 'Year' y 'Sex'.

¡Copiado!

1	*Q3) Obtain the Discptive statistics of Age Height and Weight by Gender and year wise.;
2	PROC MEANS DATA=biology;
3	var Age Height Weight;
4	class year sex;

13 Bloque de código

PROC MEANS Data

Explicación :
Calcula las estadísticas descriptivas (medias, desviaciones estándar, asimetrías y medianas) para las variables 'Height' y 'Weight' del dataset 'biology', agrupadas por 'Year' y 'Sex'. Los resultados se almacenan en un nuevo dataset llamado 'Stats_biology'.

¡Copiado!

1	*Q4) store Descriptive statistics in a specific variable.;
2	PROC MEANS DATA=biology;
3	class year sex;
4	OUTPUT out=Stats_biology mean=av_height av_weight std=sd_height sd_weight skewness=sk_height sk_weight median=md_height md_weight;

14 Bloque de código

PROC PRINT

Explicación :
Muestra el contenido del dataset 'Stats_biology', que contiene las estadísticas descriptivas calculadas y almacenadas por la `PROC MEANS` anterior.

¡Copiado!

1	PROC PRINT DATA=Stats_biology;
2	RUN;

15 Bloque de código

PROC UNIVARIATE

Explicación :
Genera estadísticas univariadas detalladas, incluyendo momentos, cuantiles, pruebas de normalidad y gráficos (si están activados), para la variable 'Height' del dataset 'biology', con el fin de examinar su distribución.

¡Copiado!

1	*Q5) Use univariate command to check the distribution of data.;
2	PROC UNIVARIATE DATA=biology;
3	var Height;
4	RUN;

16 Bloque de código

PROC MEANS

Explicación :
Calcula las estadísticas descriptivas básicas para todas las variables numéricas del dataset 'biology', formateando las salidas numéricas para mostrar un máximo de dos decimales gracias a la opción `maxdec=2`.

¡Copiado!

1	*Q6) Use
2	proc mean command and get the output upto two decimel;
3	PROC MEANS
4	DATA=biology maxdec=2;
5	RUN;
6

Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.

Retour à la liste