Dieses Programm generiert zunächst eine synthetische Population von 10.000 Individuen mit Geschlechts- und Größenattributen. Es berechnet deskriptive Statistiken (Mittelwert, Standardabweichung, Konfidenzintervall) für die Gesamtpopulation. Anschließend werden zwei einfache Zufallsstichproben (SRS) unterschiedlicher Größen (10 und 1.000 Individuen) mit dem SURVEYSELECT-Verfahren gezogen, um zu veranschaulichen, wie eine Erhöhung der Stichprobengröße die Breite des 95%-Konfidenzintervalls reduziert.
Datenanalyse
Type : INTERNE_ERZEUGUNG
Die Daten werden vollständig über einen DATA-Schritt mithilfe von Zufallsfunktionen (uniform, normal) generiert, um 10.000 Beobachtungen zu simulieren.
1 Codeblock
DATA STEP Data
Erklärung : Erstellung eines Datensatzes 'random10000' mit 10.000 simulierten Beobachtungen. Die Variable 'male' wird gleichmäßig bestimmt und die Variable 'height' wird gemäß einer geschlechtsabhängigen Normalverteilung generiert.
Kopiert!
data random10000 (drop = i x);
do i=1 to 10000;
x = uniform(123456);
if x >.5 then male = 1;
else male = 0;
if male = 1 then height = round(71 + 4.32*normal(0), .01);
else if male = 0 then height = round(64.3 + 2.11*normal(0), .01);
output;
end;
run;
1
DATA random10000 (drop = i x);
2
DO i=1 to 10000;
3
x = uniform(123456);
4
IF x >.5THEN male = 1;
5
ELSE male = 0;
6
IF male = 1THEN height = round(71 + 4.32*normal(0), .01);
7
ELSEIF male = 0 THEN height = round(64.3 + 2.11*normal(0), .01);
8
OUTPUT;
9
END;
10
RUN;
2 Codeblock
PROC MEANS
Erklärung : Berechnung deskriptiver Statistiken für die Gesamtpopulation, einschließlich Mittelwert, Standardabweichung und 95%-Konfidenzgrenzen des Mittelwerts (CLM).
Kopiert!
proc means data = random10000 n mean std clm;
var height;
run;
1
2
PROC MEANS
3
DATA = random10000 n mean std clm;
4
var height;
5
RUN;
6
3 Codeblock
PROC SURVEYSELECT Data
Erklärung : Auswahl einer einfachen Zufallsstichprobe (SRS) von 10 Beobachtungen aus der Population 'random10000', gespeichert in der Tabelle 'random10'.
Erklärung : Berechnung deskriptiver Statistiken und des Konfidenzintervalls für die kleine Stichprobe von 10 Individuen.
Kopiert!
proc means data = random10 n mean std clm;
var height;
run;
1
2
PROC MEANS
3
DATA = random10 n mean std clm;
4
var height;
5
RUN;
6
5 Codeblock
PROC SURVEYSELECT Data
Erklärung : Auswahl einer größeren einfachen Zufallsstichprobe (SRS) von 1.000 Beobachtungen aus der Population 'random10000', gespeichert in der Tabelle 'random1000'.
Erklärung : Berechnung deskriptiver Statistiken und des Konfidenzintervalls für die große Stichprobe von 1.000 Individuen, um die Präzision mit der vorherigen Stichprobe zu vergleichen.
Kopiert!
proc means data = random1000 n mean std clm;
var height;
run;
1
2
PROC MEANS
3
DATA = random1000 n mean std clm;
4
var height;
5
RUN;
6
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.