Publicado el :
Estadística CREATION_INTERNE

Cálculo de Intervalos de Confianza al 95%

Este código también está disponible en: Deutsch English Español Français
En espera de validación
El script comienza creando un conjunto de datos de 10.000 observaciones simulando la altura de participantes masculinos y femeninos utilizando funciones de distribución aleatoria. Luego, utiliza el procedimiento SURVEYSELECT para extraer dos muestras aleatorias simples de esta población: una pequeña de 10 observaciones y una más grande de 1000 observaciones. El objetivo es preparar los datos para el análisis del impacto del tamaño de la muestra en la media y los intervalos de confianza, aunque los pasos para calcular estas estadísticas no están implementados en el código proporcionado y se dejan como ejercicio.
Análisis de datos

Type : CREATION_INTERNE


Los datos se generan completamente en un paso DATA. Se crea una población de 10.000 observaciones utilizando las funciones uniform() y normal() para simular alturas de manera aleatoria.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque de datos crea la tabla 'random10000'. Genera 10.000 observaciones en bucle. Para cada observación, asigna un sexo (variable 'male') basado en una función uniforme, luego calcula una altura ('height') utilizando una distribución normal con parámetros diferentes para hombres y mujeres.
¡Copiado!
1DATA random10000 (drop = i x);
2 DO i=1 to 10000;
3 x = uniform(123456);
4 IF x >.5 THEN male = 1;
5 ELSE male = 0;
6 IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7 ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8 OUTPUT;
9 END;
10RUN;
2 Bloque de código
PROC SURVEYSELECT Data
Explicación :
Este procedimiento extrae una muestra aleatoria simple (method=srs) de 10 observaciones (sampsize=10) de la tabla 'random10000'. El resultado se almacena en una nueva tabla llamada 'random10'.
¡Copiado!
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 10
4 out = random10;
5RUN;
3 Bloque de código
PROC SURVEYSELECT Data
Explicación :
Similar al bloque anterior, este procedimiento extrae una muestra aleatoria simple de un tamaño más considerable de 1000 observaciones (sampsize=1000) de la tabla 'random10000'. El resultado se almacena en la tabla 'random1000'.
¡Copiado!
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 1000
4 out = random1000;
5RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.