Berechnung von 95%-Konfidenzintervallen und Stichproben-Simulation

Dieses Programm generiert zunächst eine synthetische Population von 10.000 Individuen mit Geschlechts- und Größenattributen. Es berechnet deskriptive Statistiken (Mittelwert, Standardabweichung, Konfidenzintervall) für die Gesamtpopulation. Anschließend werden zwei einfache Zufallsstichproben (SRS) unterschiedlicher Größen (10 und 1.000 Individuen) mit dem SURVEYSELECT-Verfahren gezogen, um zu veranschaulichen, wie eine Erhöhung der Stichprobengröße die Breite des 95%-Konfidenzintervalls reduziert.

Datenanalyse

Type : INTERNE_ERZEUGUNG

Die Daten werden vollständig über einen DATA-Schritt mithilfe von Zufallsfunktionen (uniform, normal) generiert, um 10.000 Beobachtungen zu simulieren.

1 Codeblock

DATA STEP Data

Erklärung :
Erstellung eines Datensatzes 'random10000' mit 10.000 simulierten Beobachtungen. Die Variable 'male' wird gleichmäßig bestimmt und die Variable 'height' wird gemäß einer geschlechtsabhängigen Normalverteilung generiert.

Kopiert!

1	DATA random10000 (drop = i x);
2	DO i=1 to 10000;
3	x = uniform(123456);
4	IF x >.5 THEN male = 1;
5	ELSE male = 0;
6	IF male = 1 THEN height = round(71 + 4.32*normal(0), .01);
7	ELSE IF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8	OUTPUT;
9	END;
10	RUN;

2 Codeblock

PROC MEANS

Erklärung :
Berechnung deskriptiver Statistiken für die Gesamtpopulation, einschließlich Mittelwert, Standardabweichung und 95%-Konfidenzgrenzen des Mittelwerts (CLM).

Kopiert!

1
2	PROC MEANS
3	DATA = random10000 n mean std clm;
4	var height;
5	RUN;
6

3 Codeblock

PROC SURVEYSELECT Data

Erklärung :
Auswahl einer einfachen Zufallsstichprobe (SRS) von 10 Beobachtungen aus der Population 'random10000', gespeichert in der Tabelle 'random10'.

Kopiert!

1	PROC SURVEYSELECT DATA=random10000
2	method = srs
3	sampsize = 10
4	out = random10;
5	RUN;

4 Codeblock

PROC MEANS

Erklärung :
Berechnung deskriptiver Statistiken und des Konfidenzintervalls für die kleine Stichprobe von 10 Individuen.

Kopiert!

1
2	PROC MEANS
3	DATA = random10 n mean std clm;
4	var height;
5	RUN;
6

5 Codeblock

PROC SURVEYSELECT Data

Erklärung :
Auswahl einer größeren einfachen Zufallsstichprobe (SRS) von 1.000 Beobachtungen aus der Population 'random10000', gespeichert in der Tabelle 'random1000'.

Kopiert!

1	PROC SURVEYSELECT DATA=random10000
2	method = srs
3	sampsize = 1000
4	out = random1000;
5	RUN;

6 Codeblock

PROC MEANS

Erklärung :
Berechnung deskriptiver Statistiken und des Konfidenzintervalls für die große Stichprobe von 1.000 Individuen, um die Präzision mit der vorherigen Stichprobe zu vergleichen.

Kopiert!

1
2	PROC MEANS
3	DATA = random1000 n mean std clm;
4	var height;
5	RUN;
6

Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.

Retour à la liste