Cálculo de Intervalos de Confianza al 95%

El script comienza creando un conjunto de datos de 10.000 observaciones simulando la altura de participantes masculinos y femeninos utilizando funciones de distribución aleatoria. Luego, utiliza el procedimiento SURVEYSELECT para extraer dos muestras aleatorias simples de esta población: una pequeña de 10 observaciones y una más grande de 1000 observaciones. El objetivo es preparar los datos para el análisis del impacto del tamaño de la muestra en la media y los intervalos de confianza, aunque los pasos para calcular estas estadísticas no están implementados en el código proporcionado y se dejan como ejercicio.

Análisis de datos

Type : CREATION_INTERNE

Los datos se generan completamente en un paso DATA. Se crea una población de 10.000 observaciones utilizando las funciones uniform() y normal() para simular alturas de manera aleatoria.

1 Bloque de código

DATA STEP Data

Explicación :
Este bloque de datos crea la tabla 'random10000'. Genera 10.000 observaciones en bucle. Para cada observación, asigna un sexo (variable 'male') basado en una función uniforme, luego calcula una altura ('height') utilizando una distribución normal con parámetros diferentes para hombres y mujeres.

¡Copiado!

1	DATA random10000 (drop = i x);
2	DO i=1 to 10000;
3	x = uniform(123456);
4	IF x >.5 THEN male = 1;
5	ELSE male = 0;
6	IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7	ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8	OUTPUT;
9	END;
10	RUN;

2 Bloque de código

PROC SURVEYSELECT Data

Explicación :
Este procedimiento extrae una muestra aleatoria simple (method=srs) de 10 observaciones (sampsize=10) de la tabla 'random10000'. El resultado se almacena en una nueva tabla llamada 'random10'.

¡Copiado!

1	PROC SURVEYSELECT DATA=random10000
2	method = srs
3	sampsize = 10
4	out = random10;
5	RUN;

3 Bloque de código

PROC SURVEYSELECT Data

Explicación :
Similar al bloque anterior, este procedimiento extrae una muestra aleatoria simple de un tamaño más considerable de 1000 observaciones (sampsize=1000) de la tabla 'random10000'. El resultado se almacena en la tabla 'random1000'.

¡Copiado!

1	PROC SURVEYSELECT DATA=random10000
2	method = srs
3	sampsize = 1000
4	out = random1000;
5	RUN;

Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.

Retour à la liste