Publié le :
Statistique CREATION_INTERNE

Calcul d'Intervalles de Confiance à 95% et Simulation d'Échantillonnage

Ce code est également disponible en : Deutsch English Español
En attente de validation
Ce programme génère d'abord une population synthétique de 10 000 individus avec des attributs de sexe et de taille. Il calcule les statistiques descriptives (moyenne, écart-type, intervalle de confiance) sur la population totale. Ensuite, il effectue deux tirages aléatoires simples (SRS) de tailles différentes (10 et 1 000 individus) à l'aide de la procédure SURVEYSELECT pour illustrer comment l'augmentation de la taille de l'échantillon réduit la largeur de l'intervalle de confiance à 95%.
Analyse des données

Type : CREATION_INTERNE


Les données sont entièrement générées via une étape DATA utilisant des fonctions aléatoires (uniform, normal) pour simuler 10 000 observations.

1 Bloc de code
DATA STEP Data
Explication :
Création d'un jeu de données 'random10000' contenant 10 000 observations simulées. La variable 'male' est déterminée uniformément et la variable 'height' est générée selon une distribution normale conditionnée par le sexe.
Copié !
1DATA random10000 (drop = i x);
2 DO i=1 to 10000;
3 x = uniform(123456);
4 IF x >.5 THEN male = 1;
5 ELSE male = 0;
6 IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7 ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8 OUTPUT;
9 END;
10RUN;
2 Bloc de code
PROC MEANS
Explication :
Calcul des statistiques descriptives sur la population totale, incluant la moyenne, l'écart-type et les limites de confiance de la moyenne (CLM) à 95%.
Copié !
1 
2PROC MEANS
3DATA = random10000 n mean std clm;
4var height;
5RUN;
6 
3 Bloc de code
PROC SURVEYSELECT Data
Explication :
Sélection d'un échantillon aléatoire simple (SRS) de 10 observations à partir de la population 'random10000', stocké dans la table 'random10'.
Copié !
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 10
4 out = random10;
5RUN;
4 Bloc de code
PROC MEANS
Explication :
Calcul des statistiques descriptives et de l'intervalle de confiance pour le petit échantillon de 10 individus.
Copié !
1 
2PROC MEANS
3DATA = random10 n mean std clm;
4var height;
5RUN;
6 
5 Bloc de code
PROC SURVEYSELECT Data
Explication :
Sélection d'un échantillon aléatoire simple (SRS) plus large de 1 000 observations à partir de la population 'random10000', stocké dans la table 'random1000'.
Copié !
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 1000
4 out = random1000;
5RUN;
6 Bloc de code
PROC MEANS
Explication :
Calcul des statistiques descriptives et de l'intervalle de confiance pour le grand échantillon de 1 000 individus, permettant de comparer la précision avec l'échantillon précédent.
Copié !
1 
2PROC MEANS
3DATA = random1000 n mean std clm;
4var height;
5RUN;
6 
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.