Das Skript initialisiert ein Dataset namens 'Color' mithilfe eines DATA-Schritts und Daten, die direkt über 'Datalines' bereitgestellt werden. Die Variablen 'Region', 'Eyes' (Augenfarbe, Zeichen), 'Hair' (Haarfarbe, Zeichen) und 'Count' (numerisch) werden definiert. Beschreibende Bezeichnungen werden den Variablen 'Eyes', 'Hair' und 'Region' zugewiesen, um die Interpretation der Ausgaben zu verbessern. Anschließend werden drei separate PROC FREQ-Blöcke für das Dataset 'Color' ausgeführt. Die ersten beiden Blöcke konzentrieren sich auf die Analyse der Häufigkeit der Variablen 'Region', wobei Binomialtests mit spezifischen Konfidenzintervallmethoden (Agresti-Coull, Wilson, exakt) für die erste ('level=1') und zweite ('level=2') Ebene der Variablen 'Region' angewendet werden, mit einem Alpha-Schwellenwert von 0,1. Die Variable 'Count' wird als Gewichtung für diese Analysen verwendet. Ein gemeinsamer Titel wird auch für die Ausgaben dieser Prozeduren definiert. Der dritte PROC FREQ-Block führt eine standardmäßige binomiale Häufigkeitsanalyse für die Variable 'Region' ohne erweiterte Spezifikationen durch. Das übergeordnete Ziel des Skripts ist es, die Verteilung und die Anteile der Augen- und Haarfarbkategorien in Abhängigkeit von der geografischen Region zu untersuchen.
Datenanalyse
Type : CREATION_INTERNE
Das Dataset 'Color' wird direkt im Skript über einen DATA-Schritt und die DATALINES-Anweisung erstellt und befüllt. Alle für die Analyse erforderlichen Daten werden intern bereitgestellt.
1 Codeblock
DATA STEP Data
Erklärung : Dieser DATA STEP-Block erstellt das Dataset 'Color', indem er die in den DATALINES bereitgestellten Rohdaten liest. Er definiert vier Variablen: 'Region' (numerisch), 'Eyes' (Zeichenkette), 'Hair' (Zeichenkette) und 'Count' (numerisch). Beschreibende Bezeichnungen werden den Variablen 'Eyes', 'Hair' und 'Region' zugewiesen, um die Lesbarkeit der Ausgabeberichte zu verbessern.
Kopiert!
data Color;
input Region Eyes $ Hair $ Count;
label Eyes ='Eye Color'
Hair ='Hair Color'
Region='Geographic Region';
datalines;
1 blue fair 23 1 blue red 7 1 blue medium 24
1 blue dark 11 1 green fair 19 1 green red 7
1 green medium 18 1 green dark 14 1 brown fair 34
1 brown red 5 1 brown medium 41 1 brown dark 40
1 brown black 3 0 blue fair 46 0 blue red 21
0 blue medium 44 0 blue dark 40 0 blue black 6
0 green fair 50 0 green red 31 0 green medium 37
0 green dark 23 0 brown fair 56 0 brown red 42
0 brown medium 53 0 brown dark 54 0 brown black 13
;
run;
1
DATA Color;
2
INPUT Region Eyes $ Hair $ Count;
3
label Eyes ='Eye Color'
4
Hair ='Hair Color'
5
Region='Geographic Region';
6
DATALINES;
7
1 blue fair 231 blue red 71 blue medium 24
8
1 blue dark 111 green fair 191 green red 7
9
1 green medium 181 green dark 141 brown fair 34
10
1 brown red 51 brown medium 411 brown dark 40
11
1 brown black 3 0 blue fair 46 0 blue red 21
12
0 blue medium 44 0 blue dark 40 0 blue black 6
13
0 green fair 50 0 green red 31 0 green medium 37
14
0 green dark 23 0 brown fair 56 0 brown red 42
15
0 brown medium 53 0 brown dark 54 0 brown black 13
16
;
17
RUN;
2 Codeblock
PROC FREQ
Erklärung : Dieser Block führt PROC FREQ für das Dataset 'Color' aus. Er generiert Häufigkeitstabellen für die Variable 'Region'. Die Option `binomial(ac wilson exact level=1) alpha=.1` fordert die Berechnung von Binomial-Konfidenzintervallen (Agresti-Coull, Wilson, exakt) für die erste Ebene von 'Region' mit einem Signifikanzniveau von 0,1 an. Die Variable 'Count' wird als Gewichtungsvariable für die Beobachtungen verwendet. Ein Titel wird auch für die Ausgabe angegeben.
Kopiert!
proc freq data=Color order=freq;
tables region / binomial(ac wilson exact level=1) alpha=.1 ;
exact binomial;
weight Count;
title 'Hair and Eye Color of European Children';
run;
1
PROC FREQDATA=Color order=freq;
2
tables region / binomial(ac wilson exact level=1) alpha=.1 ;
3
exact binomial;
4
weight Count;
5
title 'Hair and Eye Color of European Children';
6
RUN;
3 Codeblock
PROC FREQ
Erklärung : Ähnlich wie der vorherige Block analysiert diese PROC FREQ ebenfalls die Variable 'Region' des Datasets 'Color'. Der Hauptunterschied ist die Option `level=2` in `binomial(ac wilson exact level=2)`, die angibt, dass die Berechnungen der Binomial-Konfidenzintervalle für die zweite Ebene der Variablen 'Region' durchgeführt werden, ebenfalls mit einem Alpha von 0,1 und 'Count' als Gewicht. Ein Titel wird auch zugewiesen.
Kopiert!
proc freq data=Color order=freq;
tables region / binomial(ac wilson exact level=2) alpha=.1 ;
exact binomial;
weight Count;
title 'Hair and Eye Color of European Children';
run;
1
PROC FREQDATA=Color order=freq;
2
tables region / binomial(ac wilson exact level=2) alpha=.1 ;
3
exact binomial;
4
weight Count;
5
title 'Hair and Eye Color of European Children';
6
RUN;
4 Codeblock
PROC FREQ
Erklärung : Dieser Block führt eine PROC FREQ für das Dataset 'Color' und die Variable 'Region' aus. Die Option `binomial` allein fordert standardmäßige Binomialstatistiken für jede Ebene von 'Region an, einschließlich Proportionen, Häufigkeiten und standardmäßiger Konfidenzintervalle, ohne erweiterte Spezifikationen der Berechnungsmethoden oder der Ebene. Die Reihenfolge der Häufigkeiten wird beibehalten.
Kopiert!
proc freq data=Color order=freq;
tables region / binomial;
run;
1
2
PROC FREQ
3
DATA=Color order=freq;
4
tables region / binomial;
5
RUN;
6
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.