Publié le :
Statistique CREATION_INTERNE

Test de différence de moyenne (T-Test) sur données simulées

Ce code est également disponible en : Deutsch English Español
En attente de validation
Ce script pédagogique illustre le processus de simulation statistique. Il commence par créer une population synthétique de 10 000 individus avec des attributs de sexe et de taille générés aléatoirement. Il calcule les vraies moyennes de la population, extrait un échantillon aléatoire simple de 50 individus, puis effectue un test T (Student) pour déterminer si la différence de taille moyenne entre les sexes est statistiquement significative sur cet échantillon.
Analyse des données

Type : CREATION_INTERNE


Les données 'random_pop1' sont générées dynamiquement dans la première étape Data Step en utilisant des fonctions de nombres aléatoires (UNIFORM, NORMAL).

1 Bloc de code
DATA STEP Data
Explication :
Génération d'une table 'random_pop1' de 10 000 observations. La variable 'male' est attribuée aléatoirement (~50%). La variable 'height' (taille) est générée selon une loi normale avec des paramètres de moyenne et d'écart-type différents selon le sexe.
Copié !
1DATA random_pop1 (drop = i x);
2 DO i=1 to 10000;
3 x = uniform(123456);
4 IF x >.5 THEN male = 1;
5 ELSE male = 0;
6 IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7 ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8 OUTPUT;
9 END;
10RUN;
2 Bloc de code
PROC MEANS
Explication :
Calcul des statistiques descriptives (moyenne, écart-type, etc.) de la variable 'height' pour chaque groupe de sexe (male) sur l'ensemble de la population générée.
Copié !
1PROC MEANS DATA = random_pop1;
2 class male;
3 var height;
4 title1 "Population Mean Height for Males and Females";
5RUN;
3 Bloc de code
PROC SURVEYSELECT Data
Explication :
Sélection d'un échantillon aléatoire simple (SRS - Simple Random Sampling) de 50 observations à partir de la population 'random_pop1', stocké dans la table de sortie 'random_subpop1'.
Copié !
1PROC SURVEYSELECT DATA=random_pop1 noprint
2 seed = 2001
3 method = srs
4 sampsize = 50
5 out = random_subpop1;
6RUN;
4 Bloc de code
PROC TTEST
Explication :
Exécution d'un test T de Student pour échantillons indépendants sur la sous-population. Il teste l'hypothèse nulle selon laquelle les moyennes de taille sont égales entre les hommes et les femmes.
Copié !
1PROC TTEST DATA = random_subpop1;
2 class male;
3 var height;
4 title1 "T-Test for Difference in Mean Height of Males and Females in Random Population 1";
5RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.