Veröffentlicht am :
Statistik INTERNE_ERZEUGUNG

Berechnung von 95%-Konfidenzintervallen und Stichproben-Simulation

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Dieses Programm generiert zunächst eine synthetische Population von 10.000 Individuen mit Geschlechts- und Größenattributen. Es berechnet deskriptive Statistiken (Mittelwert, Standardabweichung, Konfidenzintervall) für die Gesamtpopulation. Anschließend werden zwei einfache Zufallsstichproben (SRS) unterschiedlicher Größen (10 und 1.000 Individuen) mit dem SURVEYSELECT-Verfahren gezogen, um zu veranschaulichen, wie eine Erhöhung der Stichprobengröße die Breite des 95%-Konfidenzintervalls reduziert.
Datenanalyse

Type : INTERNE_ERZEUGUNG


Die Daten werden vollständig über einen DATA-Schritt mithilfe von Zufallsfunktionen (uniform, normal) generiert, um 10.000 Beobachtungen zu simulieren.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellung eines Datensatzes 'random10000' mit 10.000 simulierten Beobachtungen. Die Variable 'male' wird gleichmäßig bestimmt und die Variable 'height' wird gemäß einer geschlechtsabhängigen Normalverteilung generiert.
Kopiert!
1DATA random10000 (drop = i x);
2 DO i=1 to 10000;
3 x = uniform(123456);
4 IF x >.5 THEN male = 1;
5 ELSE male = 0;
6 IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7 ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8 OUTPUT;
9 END;
10RUN;
2 Codeblock
PROC MEANS
Erklärung :
Berechnung deskriptiver Statistiken für die Gesamtpopulation, einschließlich Mittelwert, Standardabweichung und 95%-Konfidenzgrenzen des Mittelwerts (CLM).
Kopiert!
1 
2PROC MEANS
3DATA = random10000 n mean std clm;
4var height;
5RUN;
6 
3 Codeblock
PROC SURVEYSELECT Data
Erklärung :
Auswahl einer einfachen Zufallsstichprobe (SRS) von 10 Beobachtungen aus der Population 'random10000', gespeichert in der Tabelle 'random10'.
Kopiert!
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 10
4 out = random10;
5RUN;
4 Codeblock
PROC MEANS
Erklärung :
Berechnung deskriptiver Statistiken und des Konfidenzintervalls für die kleine Stichprobe von 10 Individuen.
Kopiert!
1 
2PROC MEANS
3DATA = random10 n mean std clm;
4var height;
5RUN;
6 
5 Codeblock
PROC SURVEYSELECT Data
Erklärung :
Auswahl einer größeren einfachen Zufallsstichprobe (SRS) von 1.000 Beobachtungen aus der Population 'random10000', gespeichert in der Tabelle 'random1000'.
Kopiert!
1PROC SURVEYSELECT DATA=random10000
2 method = srs
3 sampsize = 1000
4 out = random1000;
5RUN;
6 Codeblock
PROC MEANS
Erklärung :
Berechnung deskriptiver Statistiken und des Konfidenzintervalls für die große Stichprobe von 1.000 Individuen, um die Präzision mit der vorherigen Stichprobe zu vergleichen.
Kopiert!
1 
2PROC MEANS
3DATA = random1000 n mean std clm;
4var height;
5RUN;
6 
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.