Veröffentlicht am :
Statistique CREATION_INTERNE

Test des Mittelwertunterschieds (T-Test) an simulierten Daten

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Dieses Lehrskript veranschaulicht den Prozess der statistischen Simulation. Es beginnt mit der Erstellung einer synthetischen Population von 10.000 Individuen mit zufällig generierten Geschlechts- und Größenattributen. Es berechnet die wahren Mittelwerte der Population, zieht eine einfache Zufallsstichprobe von 50 Individuen und führt dann einen T-Test (Student) durch, um festzustellen, ob der Unterschied in der mittleren Größe zwischen den Geschlechtern in dieser Stichprobe statistisch signifikant ist.
Datenanalyse

Type : CREATION_INTERNE


Die Daten 'random_pop1' werden dynamisch im ersten Data Step unter Verwendung von Zufallszahlenfunktionen (UNIFORM, NORMAL) generiert.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellung einer Tabelle 'random_pop1' mit 10.000 Beobachtungen. Die Variable 'male' wird zufällig zugewiesen (~50%). Die Variable 'height' (Größe) wird nach einer Normalverteilung mit unterschiedlichen Mittelwert- und Standardabweichungsparametern je nach Geschlecht generiert.
Kopiert!
1DATA random_pop1 (drop = i x);
2 DO i=1 to 10000;
3 x = uniform(123456);
4 IF x >.5 THEN male = 1;
5 ELSE male = 0;
6 IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7 ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8 OUTPUT;
9 END;
10RUN;
2 Codeblock
PROC MEANS
Erklärung :
Berechnung deskriptiver Statistiken (Mittelwert, Standardabweichung usw.) der Variablen 'height' für jede Geschlechtsgruppe (male) in der gesamten generierten Population.
Kopiert!
1PROC MEANS DATA = random_pop1;
2 class male;
3 var height;
4 title1 "Population Mean Height for Males and Females";
5RUN;
3 Codeblock
PROC SURVEYSELECT Data
Erklärung :
Auswahl einer einfachen Zufallsstichprobe (SRS - Simple Random Sampling) von 50 Beobachtungen aus der Population 'random_pop1', gespeichert in der Ausgabetabelle 'random_subpop1'.
Kopiert!
1PROC SURVEYSELECT DATA=random_pop1 noprint
2 seed = 2001
3 method = srs
4 sampsize = 50
5 out = random_subpop1;
6RUN;
4 Codeblock
PROC TTEST
Erklärung :
Durchführung eines Student-T-Tests für unabhängige Stichproben in der Subpopulation. Er testet die Nullhypothese, dass die mittleren Größen von Männern und Frauen gleich sind.
Kopiert!
1PROC TTEST DATA = random_subpop1;
2 class male;
3 var height;
4 title1 "T-Test for Difference in Mean Height of Males and Females in Random Population 1";
5RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.