El script inicializa un conjunto de datos llamado 'Color' utilizando un paso DATA y datos proporcionados directamente a través de 'datalines'. Se definen las variables 'Region', 'Eyes' (color de ojos, carácter), 'Hair' (color de cabello, carácter) y 'Count' (numérica). Se asignan etiquetas descriptivas a las variables 'Eyes', 'Hair' y 'Region' para una mejor interpretación de las salidas. Posteriormente, se ejecutan tres bloques PROC FREQ distintos en el conjunto de datos 'Color'. Los dos primeros bloques se centran en el análisis de la frecuencia de la variable 'Region', aplicando pruebas binomiales con métodos de intervalo de confianza específicos (Agresti-Coull, Wilson, exacto) para el primer ('level=1') y el segundo ('level=2') nivel de la variable 'Region', con un umbral alfa de 0.1. La variable 'Count' se utiliza como ponderación para estos análisis. También se define un título común para las salidas de estos procedimientos. El tercer bloque PROC FREQ realiza un análisis de frecuencia binomial estándar en la variable 'Region' sin especificaciones avanzadas. El objetivo general del script es examinar la distribución y las proporciones de las categorías de colores de ojos y cabello en función de la región geográfica.
Análisis de datos
Type : CREATION_INTERNE
El conjunto de datos 'Color' se crea y se llena directamente en el script a través de un paso DATA y la instrucción DATALINES. Todos los datos necesarios para el análisis se proporcionan internamente.
1 Bloque de código
DATA STEP Data
Explicación : Este bloque DATA STEP crea el conjunto de datos 'Color' leyendo los datos brutos proporcionados en las DATALINES. Define cuatro variables: 'Region' (numérica), 'Eyes' (cadena de caracteres), 'Hair' (cadena de caracteres) y 'Count' (numérica). Se asignan etiquetas descriptivas a las variables 'Eyes', 'Hair' y 'Region' para mejorar la legibilidad de los informes de salida.
¡Copiado!
data Color;
input Region Eyes $ Hair $ Count;
label Eyes ='Eye Color'
Hair ='Hair Color'
Region='Geographic Region';
datalines;
1 blue fair 23 1 blue red 7 1 blue medium 24
1 blue dark 11 1 green fair 19 1 green red 7
1 green medium 18 1 green dark 14 1 brown fair 34
1 brown red 5 1 brown medium 41 1 brown dark 40
1 brown black 3 0 blue fair 46 0 blue red 21
0 blue medium 44 0 blue dark 40 0 blue black 6
0 green fair 50 0 green red 31 0 green medium 37
0 green dark 23 0 brown fair 56 0 brown red 42
0 brown medium 53 0 brown dark 54 0 brown black 13
;
run;
1
DATA Color;
2
INPUT Region Eyes $ Hair $ Count;
3
label Eyes ='Eye Color'
4
Hair ='Hair Color'
5
Region='Geographic Region';
6
DATALINES;
7
1 blue fair 231 blue red 71 blue medium 24
8
1 blue dark 111 green fair 191 green red 7
9
1 green medium 181 green dark 141 brown fair 34
10
1 brown red 51 brown medium 411 brown dark 40
11
1 brown black 3 0 blue fair 46 0 blue red 21
12
0 blue medium 44 0 blue dark 40 0 blue black 6
13
0 green fair 50 0 green red 31 0 green medium 37
14
0 green dark 23 0 brown fair 56 0 brown red 42
15
0 brown medium 53 0 brown dark 54 0 brown black 13
16
;
17
RUN;
2 Bloque de código
PROC FREQ
Explicación : Este bloque ejecuta PROC FREQ en el conjunto de datos 'Color'. Genera tablas de frecuencias para la variable 'Region'. La opción `binomial(ac wilson exact level=1) alpha=.1` solicita el cálculo de intervalos de confianza binomiales (Agresti-Coull, Wilson, exacto) para el primer nivel de 'Region', con un nivel de significancia de 0.1. La variable 'Count' se utiliza como variable de ponderación de las observaciones. También se especifica un título para la salida.
¡Copiado!
proc freq data=Color order=freq;
tables region / binomial(ac wilson exact level=1) alpha=.1 ;
exact binomial;
weight Count;
title 'Hair and Eye Color of European Children';
run;
1
PROC FREQDATA=Color order=freq;
2
tables region / binomial(ac wilson exact level=1) alpha=.1 ;
3
exact binomial;
4
weight Count;
5
title 'Hair and Eye Color of European Children';
6
RUN;
3 Bloque de código
PROC FREQ
Explicación : Similar al bloque anterior, esta PROC FREQ también analiza la variable 'Region' del conjunto de datos 'Color'. La principal diferencia es la opción `level=2` en `binomial(ac wilson exact level=2)`, que indica que los cálculos de intervalos de confianza binomiales se realizan para el segundo nivel de la variable 'Region', siempre con un alfa de 0.1 y 'Count' como peso. También se asigna un título.
¡Copiado!
proc freq data=Color order=freq;
tables region / binomial(ac wilson exact level=2) alpha=.1 ;
exact binomial;
weight Count;
title 'Hair and Eye Color of European Children';
run;
1
PROC FREQDATA=Color order=freq;
2
tables region / binomial(ac wilson exact level=2) alpha=.1 ;
3
exact binomial;
4
weight Count;
5
title 'Hair and Eye Color of European Children';
6
RUN;
4 Bloque de código
PROC FREQ
Explicación : Este bloque ejecuta una PROC FREQ en el conjunto de datos 'Color' para la variable 'Region'. La opción `binomial` sola solicita estadísticas binomiales estándar para cada nivel de 'Region', incluyendo proporciones, frecuencias e intervalos de confianza predeterminados, sin especificaciones avanzadas de los métodos de cálculo o del nivel. Se mantiene el orden de las frecuencias.
¡Copiado!
proc freq data=Color order=freq;
tables region / binomial;
run;
1
2
PROC FREQ
3
DATA=Color order=freq;
4
tables region / binomial;
5
RUN;
6
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute Inc. en los EE. UU. y otros países. ® indica registro en los EE. UU. WeAreCAS es un sitio comunitario independiente y no está afiliado a SAS Institute Inc.
Este sitio utiliza cookies técnicas y analíticas para mejorar su experiencia.
Saber más.