El script está estructurado en varias secciones independientes. La primera sección crea un dataset 'scoredata' y deriva un subconjunto 'subsetscoredata' filtrando las observaciones según una condición en 'scorevalues'. La segunda sección inicializa un dataset 'demography' para luego realizar análisis de frecuencia sobre la variable 'Gender' con `PROC FREQ` y estadísticas descriptivas sobre 'Age', 'Weight', 'Height' con `PROC MEANS`. La sección principal crea un dataset 'biology' y aplica una serie de análisis estadísticos: cálculo de las medias para 'Age', 'Height', 'Weight', luego estadísticas descriptivas agrupadas por 'Sex', y después por 'Year' y 'Sex'. Se utiliza específicamente un `PROC MEANS` para guardar las estadísticas descriptivas calculadas (medias, desviaciones estándar, asimetrías, medianas) en un nuevo dataset llamado 'Stats_biology'. Finalmente, el script utiliza `PROC UNIVARIATE` para un análisis de distribución de 'Height' y `PROC MEANS` con la opción `maxdec=2` para formatear la salida de las estadísticas.
Análisis de datos
Type : CREACION_INTERNE
Todos los datasets ('scoredata', 'subsetscoredata', 'demography', 'biology', 'Stats_biology') se crean directamente dentro del script utilizando bloques `DATA STEP` con datos `datalines` integrados, o se derivan de estos datasets internos. No se hace referencia ni se requiere ninguna fuente de datos externa (archivos, bases de datos) para la ejecución del script.
1 Bloque de código
DATA STEP Data
Explicación : Crea un dataset llamado 'scoredata' con dos variables, 'A' (carácter) y 'Scorevalues' (numérica), utilizando datos proporcionados directamente a través de `datalines`.
¡Copiado!
data scoredata;
input A $ Scorevalues;
datalines;
P 77 P 76 P 74 P 72 P 78
D 80 D 84 D 88 D 87 D 90
run;
1
DATA scoredata;
2
INPUT A $ Scorevalues;
3
DATALINES;
4
P 77 P 76 P 74 P 72 P 78
5
D 80 D 84 D 88 D 87 D 90
6
RUN;
2 Bloque de código
PROC PRINT
Explicación : Muestra el contenido del dataset 'scoredata' en la salida SAS estándar.
¡Copiado!
proc print data=scoredata;
1
PROC PRINTDATA=scoredata;
3 Bloque de código
DATA STEP Data
Explicación : Crea un nuevo dataset llamado 'subsetscoredata' a partir de 'scoredata', incluyendo solo las observaciones donde el valor de 'Scorevalues' es estrictamente superior a 78.
¡Copiado!
data subsetscoredata;
set scoredata;
if scorevalues>78;
run;
1
DATA subsetscoredata;
2
SET scoredata;
3
IF scorevalues>78;
4
RUN;
4 Bloque de código
PROC PRINT
Explicación : Muestra el contenido del dataset 'subsetscoredata' en la salida SAS estándar.
¡Copiado!
proc print data=subsetscoredata;
1
PROC PRINTDATA=subsetscoredata;
5 Bloque de código
DATA STEP Data
Explicación : Crea un dataset llamado 'demography' con variables 'Gender' (carácter), 'Age', 'Weight' y 'Height' (numéricas), utilizando datos proporcionados a través de `datalines`. La instrucción `title Demography;` define un título para las próximas salidas de procedimientos.
¡Copiado!
*Q4;
data demography;
input Gender $ Age Weight Height;
datalines;
M 50 68 155
F 23 60 165
M 65 72 180
F 35 55 154
M 15 35 158
run;
title Demography;
1
*Q4;
2
DATA demography;
3
INPUT Gender $ Age Weight Height;
4
DATALINES;
5
M 5068155
6
F 2360165
7
M 6572180
8
F 3555154
9
M 1535158
10
RUN;
11
title Demography;
6 Bloque de código
PROC FREQ
Explicación : Calcula y muestra la distribución de frecuencias para la variable 'Gender' del dataset 'demography', mostrando el número y el porcentaje de ocurrencias para cada categoría de género.
¡Copiado!
proc freq data=demography;
table Gender;
1
PROC FREQDATA=demography;
2
TABLE Gender;
7 Bloque de código
PROC MEANS
Explicación : Calcula las estadísticas descriptivas básicas (N, media, desviación estándar, mínimo, máximo) para las variables 'Age', 'Weight' y 'Height' del dataset 'demography'.
¡Copiado!
proc means data=demography;
Var Age Weight height;
1
PROC MEANSDATA=demography;
2
Var Age Weight height;
8 Bloque de código
DATA STEP Data
Explicación : Crea un dataset llamado 'biology' con variables 'Id' (numérica), 'sex' (carácter), 'Age', 'Year', 'Height' y 'Weight' (numéricas), utilizando datos proporcionados directamente a través de `datalines`.
¡Copiado!
*------------------------------------;
data biology;
input Id sex $ Age Year Height Weight;
datalines;
7389 M 24 4 69.2 132.5
3945 F 19 2 58.5 112.8
4721 F 20 2 65.3 98.6
1835 F 24 4 62.8 102.5
9541 M 21 3 72.5 152.3
2957 M 22 3 67.3 145.8
2158 F 21 2 59.8 104.5
4296 F 25 3 62.5 132.5
4824 M 23 4 74.5 184.4
5736 M 22 3 69.1 149.5
8765 F 19 1 67.3 130.5
5734 F 18 1 64.3 110.2
run;
1
*------------------------------------;
2
DATA biology;
3
INPUT Id sex $ Age Year Height Weight;
4
DATALINES;
5
7389 M 24469.2132.5
6
3945 F 19258.5112.8
7
4721 F 20265.398.6
8
1835 F 24462.8102.5
9
9541 M 21372.5152.3
10
2957 M 22367.3145.8
11
2158 F 21259.8104.5
12
4296 F 25362.5132.5
13
4824 M 23474.5184.4
14
5736 M 22369.1149.5
15
8765 F 19167.3130.5
16
5734 F 18164.3110.2
17
RUN;
9 Bloque de código
PROC PRINT
Explicación : Muestra el contenido completo del dataset 'biology' en la salida SAS estándar.
¡Copiado!
proc print data=biology;
run;
1
PROC PRINTDATA=biology;
2
RUN;
10 Bloque de código
PROC MEANS
Explicación : Calcula las estadísticas descriptivas básicas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology'.
¡Copiado!
*Q1) Obtain the means of Age,Height and Weight.;
proc means data=biology;
var Age Height Weight;
run;
1
*Q1) Obtain the means of Age,Height and Weight.;
2
PROC MEANSDATA=biology;
3
var Age Height Weight;
4
RUN;
11 Bloque de código
PROC MEANS
Explicación : Calcula las estadísticas descriptivas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology', agrupadas por cada categoría de la variable 'Sex'.
¡Copiado!
*Q2) Obtain the Discptive statistics of Age Height and Weight by Gender wise.;
proc means data=biology;
var Age Height Weight;
class Sex;
run;
1
*Q2) Obtain the Discptive statistics of Age Height and Weight by Gender wise.;
2
PROC MEANSDATA=biology;
3
var Age Height Weight;
4
class Sex;
5
RUN;
12 Bloque de código
PROC MEANS
Explicación : Calcula las estadísticas descriptivas para las variables 'Age', 'Height' y 'Weight' del dataset 'biology', agrupadas conjuntamente por las variables 'Year' y 'Sex'.
¡Copiado!
*Q3) Obtain the Discptive statistics of Age Height and Weight by Gender and year wise.;
proc means data=biology;
var Age Height Weight;
class year sex;
1
*Q3) Obtain the Discptive statistics of Age Height and Weight by Gender and year wise.;
2
PROC MEANSDATA=biology;
3
var Age Height Weight;
4
class year sex;
13 Bloque de código
PROC MEANS Data
Explicación : Calcula las estadísticas descriptivas (medias, desviaciones estándar, asimetrías y medianas) para las variables 'Height' y 'Weight' del dataset 'biology', agrupadas por 'Year' y 'Sex'. Los resultados se almacenan en un nuevo dataset llamado 'Stats_biology'.
¡Copiado!
*Q4) store Descriptive statistics in a specific variable.;
proc means data=biology;
class year sex;
Output out=Stats_biology mean=av_height av_weight std=sd_height sd_weight skewness=sk_height sk_weight median=md_height md_weight;
1
*Q4) store Descriptive statistics in a specific variable.;
Explicación : Muestra el contenido del dataset 'Stats_biology', que contiene las estadísticas descriptivas calculadas y almacenadas por la `PROC MEANS` anterior.
¡Copiado!
proc print data=Stats_biology;
run;
1
PROC PRINTDATA=Stats_biology;
2
RUN;
15 Bloque de código
PROC UNIVARIATE
Explicación : Genera estadísticas univariadas detalladas, incluyendo momentos, cuantiles, pruebas de normalidad y gráficos (si están activados), para la variable 'Height' del dataset 'biology', con el fin de examinar su distribución.
¡Copiado!
*Q5) Use univariate command to check the distribution of data.;
proc univariate data=biology;
var Height;
run;
1
*Q5) Use univariate command to check the distribution of data.;
2
PROC UNIVARIATEDATA=biology;
3
var Height;
4
RUN;
16 Bloque de código
PROC MEANS
Explicación : Calcula las estadísticas descriptivas básicas para todas las variables numéricas del dataset 'biology', formateando las salidas numéricas para mostrar un máximo de dos decimales gracias a la opción `maxdec=2`.
¡Copiado!
*Q6) Use proc mean command and get the output upto two decimel;
proc means data=biology maxdec=2;
run;
1
*Q6) Use
2
proc mean command and get the output upto two decimel;
3
PROC MEANS
4
DATA=biology maxdec=2;
5
RUN;
6
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute Inc. en los EE. UU. y otros países. ® indica registro en los EE. UU. WeAreCAS es un sitio comunitario independiente y no está afiliado a SAS Institute Inc.
Este sitio utiliza cookies técnicas y analíticas para mejorar su experiencia.
Saber más.