Publicado el :
Statistique CREATION_INTERNE

Análisis de la Frecuencia del Color de Ojos y Cabello por Región

Este código también está disponible en: Deutsch English Français
En espera de validación
El script inicializa un conjunto de datos llamado 'Color' utilizando un paso DATA y datos proporcionados directamente a través de 'datalines'. Se definen las variables 'Region', 'Eyes' (color de ojos, carácter), 'Hair' (color de cabello, carácter) y 'Count' (numérica). Se asignan etiquetas descriptivas a las variables 'Eyes', 'Hair' y 'Region' para una mejor interpretación de las salidas. Posteriormente, se ejecutan tres bloques PROC FREQ distintos en el conjunto de datos 'Color'. Los dos primeros bloques se centran en el análisis de la frecuencia de la variable 'Region', aplicando pruebas binomiales con métodos de intervalo de confianza específicos (Agresti-Coull, Wilson, exacto) para el primer ('level=1') y el segundo ('level=2') nivel de la variable 'Region', con un umbral alfa de 0.1. La variable 'Count' se utiliza como ponderación para estos análisis. También se define un título común para las salidas de estos procedimientos. El tercer bloque PROC FREQ realiza un análisis de frecuencia binomial estándar en la variable 'Region' sin especificaciones avanzadas. El objetivo general del script es examinar la distribución y las proporciones de las categorías de colores de ojos y cabello en función de la región geográfica.
Análisis de datos

Type : CREATION_INTERNE


El conjunto de datos 'Color' se crea y se llena directamente en el script a través de un paso DATA y la instrucción DATALINES. Todos los datos necesarios para el análisis se proporcionan internamente.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque DATA STEP crea el conjunto de datos 'Color' leyendo los datos brutos proporcionados en las DATALINES. Define cuatro variables: 'Region' (numérica), 'Eyes' (cadena de caracteres), 'Hair' (cadena de caracteres) y 'Count' (numérica). Se asignan etiquetas descriptivas a las variables 'Eyes', 'Hair' y 'Region' para mejorar la legibilidad de los informes de salida.
¡Copiado!
1DATA Color;
2 INPUT Region Eyes $ Hair $ Count;
3 label Eyes ='Eye Color'
4 Hair ='Hair Color'
5 Region='Geographic Region';
6 DATALINES;
71 blue fair 23 1 blue red 7 1 blue medium 24
81 blue dark 11 1 green fair 19 1 green red 7
91 green medium 18 1 green dark 14 1 brown fair 34
101 brown red 5 1 brown medium 41 1 brown dark 40
111 brown black 3 0 blue fair 46 0 blue red 21
120 blue medium 44 0 blue dark 40 0 blue black 6
130 green fair 50 0 green red 31 0 green medium 37
140 green dark 23 0 brown fair 56 0 brown red 42
150 brown medium 53 0 brown dark 54 0 brown black 13
16;
17RUN;
2 Bloque de código
PROC FREQ
Explicación :
Este bloque ejecuta PROC FREQ en el conjunto de datos 'Color'. Genera tablas de frecuencias para la variable 'Region'. La opción `binomial(ac wilson exact level=1) alpha=.1` solicita el cálculo de intervalos de confianza binomiales (Agresti-Coull, Wilson, exacto) para el primer nivel de 'Region', con un nivel de significancia de 0.1. La variable 'Count' se utiliza como variable de ponderación de las observaciones. También se especifica un título para la salida.
¡Copiado!
1PROC FREQ DATA=Color order=freq;
2 tables region / binomial(ac wilson exact level=1) alpha=.1 ;
3 exact binomial;
4 weight Count;
5 title 'Hair and Eye Color of European Children';
6RUN;
3 Bloque de código
PROC FREQ
Explicación :
Similar al bloque anterior, esta PROC FREQ también analiza la variable 'Region' del conjunto de datos 'Color'. La principal diferencia es la opción `level=2` en `binomial(ac wilson exact level=2)`, que indica que los cálculos de intervalos de confianza binomiales se realizan para el segundo nivel de la variable 'Region', siempre con un alfa de 0.1 y 'Count' como peso. También se asigna un título.
¡Copiado!
1PROC FREQ DATA=Color order=freq;
2 tables region / binomial(ac wilson exact level=2) alpha=.1 ;
3 exact binomial;
4 weight Count;
5 title 'Hair and Eye Color of European Children';
6RUN;
4 Bloque de código
PROC FREQ
Explicación :
Este bloque ejecuta una PROC FREQ en el conjunto de datos 'Color' para la variable 'Region'. La opción `binomial` sola solicita estadísticas binomiales estándar para cada nivel de 'Region', incluyendo proporciones, frecuencias e intervalos de confianza predeterminados, sin especificaciones avanzadas de los métodos de cálculo o del nivel. Se mantiene el orden de las frecuencias.
¡Copiado!
1 
2PROC FREQ
3DATA=Color order=freq;
4tables region / binomial;
5RUN;
6 
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.