Publié le :
Statistique CREATION_INTERNE

Calcul des Intervalles de Confiance à 95%

Ce code est également disponible en : Deutsch English Español Français
En attente de validation
Le script commence par créer un jeu de données de 10 000 observations simulant la taille de participants masculins et féminins à l'aide de fonctions de distribution aléatoire. Ensuite, il utilise la procédure SURVEYSELECT pour extraire deux échantillons aléatoires simples de cette population : un petit de 10 observations et un plus grand de 1000 observations. L'objectif est de préparer les données pour l'analyse de l'impact de la taille de l'échantillon sur la moyenne et les intervalles de confiance, bien que les étapes de calcul de ces statistiques ne soient pas implémentées dans le code fourni et soient laissées en exercice.
Analyse des données

Type : CREATION_INTERNE


Les données sont entièrement générées dans une étape DATA. Une population de 10 000 observations est créée en utilisant les fonctions uniform() et normal() pour simuler des tailles de manière aléatoire.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc de données crée la table 'random10000'. Il génère 10 000 observations en boucle. Pour chaque observation, il assigne un sexe (variable 'male') basé sur une fonction uniforme, puis calcule une taille ('height') en utilisant une distribution normale avec des paramètres différents pour les hommes et les femmes.
Copié !
1DATA random10000 (drop = i x);
2 DO i=1 to 10000;
3 x = uniform(123456);
4 IF x >.5 THEN male = 1;
5 ELSE male = 0;
6 IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7 ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8 OUTPUT;
9 END;
10RUN;
2 Bloc de code
PROC SURVEYSELECT Data
Explication :
Cette procédure extrait un échantillon aléatoire simple (method=srs) de 10 observations (sampsize=10) à partir de la table 'random10000'. Le résultat est stocké dans une nouvelle table nommée 'random10'.
Copié !
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 10
4 out = random10;
5RUN;
3 Bloc de code
PROC SURVEYSELECT Data
Explication :
Similaire au bloc précédent, cette procédure extrait un échantillon aléatoire simple d'une taille plus conséquente de 1000 observations (sampsize=1000) à partir de la table 'random10000'. Le résultat est stocké dans la table 'random1000'.
Copié !
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 1000
4 out = random1000;
5RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.