Ce programme génère d'abord une population synthétique de 10 000 individus avec des attributs de sexe et de taille. Il calcule les statistiques descriptives (moyenne, écart-type, intervalle de confiance) sur la population totale. Ensuite, il effectue deux tirages aléatoires simples (SRS) de tailles différentes (10 et 1 000 individus) à l'aide de la procédure SURVEYSELECT pour illustrer comment l'augmentation de la taille de l'échantillon réduit la largeur de l'intervalle de confiance à 95%.
Analyse des données
Type : CREATION_INTERNE
Les données sont entièrement générées via une étape DATA utilisant des fonctions aléatoires (uniform, normal) pour simuler 10 000 observations.
1 Bloc de code
DATA STEP Data
Explication : Création d'un jeu de données 'random10000' contenant 10 000 observations simulées. La variable 'male' est déterminée uniformément et la variable 'height' est générée selon une distribution normale conditionnée par le sexe.
Copié !
data random10000 (drop = i x);
do i=1 to 10000;
x = uniform(123456);
if x >.5 then male = 1;
else male = 0;
if male = 1 then height = round(71 + 4.32*normal(0), .01);
else if male = 0 then height = round(64.3 + 2.11*normal(0), .01);
output;
end;
run;
1
DATA random10000 (drop = i x);
2
DO i=1 to 10000;
3
x = uniform(123456);
4
IF x >.5THEN male = 1;
5
ELSE male = 0;
6
IF male = 1THEN height = round(71 + 4.32*normal(0), .01);
7
ELSEIF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8
OUTPUT;
9
END;
10
RUN;
2 Bloc de code
PROC MEANS
Explication : Calcul des statistiques descriptives sur la population totale, incluant la moyenne, l'écart-type et les limites de confiance de la moyenne (CLM) à 95%.
Copié !
proc means data = random10000 n mean std clm;
var height;
run;
1
2
PROC MEANS
3
DATA = random10000 n mean std clm;
4
var height;
5
RUN;
6
3 Bloc de code
PROC SURVEYSELECT Data
Explication : Sélection d'un échantillon aléatoire simple (SRS) de 10 observations à partir de la population 'random10000', stocké dans la table 'random10'.
Explication : Calcul des statistiques descriptives et de l'intervalle de confiance pour le petit échantillon de 10 individus.
Copié !
proc means data = random10 n mean std clm;
var height;
run;
1
2
PROC MEANS
3
DATA = random10 n mean std clm;
4
var height;
5
RUN;
6
5 Bloc de code
PROC SURVEYSELECT Data
Explication : Sélection d'un échantillon aléatoire simple (SRS) plus large de 1 000 observations à partir de la population 'random10000', stocké dans la table 'random1000'.
Explication : Calcul des statistiques descriptives et de l'intervalle de confiance pour le grand échantillon de 1 000 individus, permettant de comparer la précision avec l'échantillon précédent.
Copié !
proc means data = random1000 n mean std clm;
var height;
run;
1
2
PROC MEANS
3
DATA = random1000 n mean std clm;
4
var height;
5
RUN;
6
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.