Veröffentlicht am :
Statistik CREATION_INTERNE

Analyse der Häufigkeit von Augen- und Haarfarben nach Region

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript initialisiert ein Dataset namens 'Color' mithilfe eines DATA-Schritts und Daten, die direkt über 'Datalines' bereitgestellt werden. Die Variablen 'Region', 'Eyes' (Augenfarbe, Zeichen), 'Hair' (Haarfarbe, Zeichen) und 'Count' (numerisch) werden definiert. Beschreibende Bezeichnungen werden den Variablen 'Eyes', 'Hair' und 'Region' zugewiesen, um die Interpretation der Ausgaben zu verbessern. Anschließend werden drei separate PROC FREQ-Blöcke für das Dataset 'Color' ausgeführt. Die ersten beiden Blöcke konzentrieren sich auf die Analyse der Häufigkeit der Variablen 'Region', wobei Binomialtests mit spezifischen Konfidenzintervallmethoden (Agresti-Coull, Wilson, exakt) für die erste ('level=1') und zweite ('level=2') Ebene der Variablen 'Region' angewendet werden, mit einem Alpha-Schwellenwert von 0,1. Die Variable 'Count' wird als Gewichtung für diese Analysen verwendet. Ein gemeinsamer Titel wird auch für die Ausgaben dieser Prozeduren definiert. Der dritte PROC FREQ-Block führt eine standardmäßige binomiale Häufigkeitsanalyse für die Variable 'Region' ohne erweiterte Spezifikationen durch. Das übergeordnete Ziel des Skripts ist es, die Verteilung und die Anteile der Augen- und Haarfarbkategorien in Abhängigkeit von der geografischen Region zu untersuchen.
Datenanalyse

Type : CREATION_INTERNE


Das Dataset 'Color' wird direkt im Skript über einen DATA-Schritt und die DATALINES-Anweisung erstellt und befüllt. Alle für die Analyse erforderlichen Daten werden intern bereitgestellt.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP-Block erstellt das Dataset 'Color', indem er die in den DATALINES bereitgestellten Rohdaten liest. Er definiert vier Variablen: 'Region' (numerisch), 'Eyes' (Zeichenkette), 'Hair' (Zeichenkette) und 'Count' (numerisch). Beschreibende Bezeichnungen werden den Variablen 'Eyes', 'Hair' und 'Region' zugewiesen, um die Lesbarkeit der Ausgabeberichte zu verbessern.
Kopiert!
1DATA Color;
2 INPUT Region Eyes $ Hair $ Count;
3 label Eyes ='Eye Color'
4 Hair ='Hair Color'
5 Region='Geographic Region';
6 DATALINES;
71 blue fair 23 1 blue red 7 1 blue medium 24
81 blue dark 11 1 green fair 19 1 green red 7
91 green medium 18 1 green dark 14 1 brown fair 34
101 brown red 5 1 brown medium 41 1 brown dark 40
111 brown black 3 0 blue fair 46 0 blue red 21
120 blue medium 44 0 blue dark 40 0 blue black 6
130 green fair 50 0 green red 31 0 green medium 37
140 green dark 23 0 brown fair 56 0 brown red 42
150 brown medium 53 0 brown dark 54 0 brown black 13
16;
17RUN;
2 Codeblock
PROC FREQ
Erklärung :
Dieser Block führt PROC FREQ für das Dataset 'Color' aus. Er generiert Häufigkeitstabellen für die Variable 'Region'. Die Option `binomial(ac wilson exact level=1) alpha=.1` fordert die Berechnung von Binomial-Konfidenzintervallen (Agresti-Coull, Wilson, exakt) für die erste Ebene von 'Region' mit einem Signifikanzniveau von 0,1 an. Die Variable 'Count' wird als Gewichtungsvariable für die Beobachtungen verwendet. Ein Titel wird auch für die Ausgabe angegeben.
Kopiert!
1PROC FREQ DATA=Color order=freq;
2 tables region / binomial(ac wilson exact level=1) alpha=.1 ;
3 exact binomial;
4 weight Count;
5 title 'Hair and Eye Color of European Children';
6RUN;
3 Codeblock
PROC FREQ
Erklärung :
Ähnlich wie der vorherige Block analysiert diese PROC FREQ ebenfalls die Variable 'Region' des Datasets 'Color'. Der Hauptunterschied ist die Option `level=2` in `binomial(ac wilson exact level=2)`, die angibt, dass die Berechnungen der Binomial-Konfidenzintervalle für die zweite Ebene der Variablen 'Region' durchgeführt werden, ebenfalls mit einem Alpha von 0,1 und 'Count' als Gewicht. Ein Titel wird auch zugewiesen.
Kopiert!
1PROC FREQ DATA=Color order=freq;
2 tables region / binomial(ac wilson exact level=2) alpha=.1 ;
3 exact binomial;
4 weight Count;
5 title 'Hair and Eye Color of European Children';
6RUN;
4 Codeblock
PROC FREQ
Erklärung :
Dieser Block führt eine PROC FREQ für das Dataset 'Color' und die Variable 'Region' aus. Die Option `binomial` allein fordert standardmäßige Binomialstatistiken für jede Ebene von 'Region an, einschließlich Proportionen, Häufigkeiten und standardmäßiger Konfidenzintervalle, ohne erweiterte Spezifikationen der Berechnungsmethoden oder der Ebene. Die Reihenfolge der Häufigkeiten wird beibehalten.
Kopiert!
1 
2PROC FREQ
3DATA=Color order=freq;
4tables region / binomial;
5RUN;
6 
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.