Nicht-parametrische Analyse der Einkommen von Kandidaten

Dieser Code ist auch verfügbar auf: English Español Français
Schwierigkeitsgrad
Anfänger
Veröffentlicht am :
Der Skript beginnt mit dem Löschen jeder bestehenden Version der Tabelle 'repincome' in der Bibliothek WORK. Anschließend wird ein FILENAME definiert, der auf eine externe CSV-Datei mit Einkommensdaten verweist. Die Prozedur PROC IMPORT wird verwendet, um diese CSV-Datei in ein temporäres SAS©-Dataset namens WORK.repincome zu laden. Nach dem Import zeigt PROC CONTENTS die Metadaten des Datasets an. Mit PROC SGPLOT werden zwei Grafiken erstellt: ein Boxplot der Einkommen pro Kandidat und ein Streudiagramm der Einkommen gegen die Kandidaten. Danach erstellt der Skript drei gefilterte Datasets (TrumpCarson, TrumpCruz, CruzCarson), indem jeweils ein spezifischer Kandidat ausgeschlossen wird. Für jedes Kandidatenpaar wird ein nicht-parametrischer Wilcoxon-Test (PROC NPAR1WAY) durchgeführt, um die Mediane der Einkommen zu vergleichen, mit einem Signifikanzniveau Alpha von 0,05. Die Titel der Tests werden für jeden Vergleich angepasst.
Datenanalyse

Type : EXTERNE


Die Daten stammen aus einer externen CSV-Datei ('/home/gsturrock0/STAT1/RepIncome..csv'), die über PROC IMPORT importiert wurde. Das Skript enthält keine internen Daten (Datalines/Cards) und verwendet auch keine SASHELP-Daten.

1 Codeblock
PROC IMPORT Data
Erklärung :
Dieser Block initialisiert die Umgebung und importiert die Daten. Das Makro %web_drop_table löscht eine bestehende SAS-Tabelle. FILENAME verknüpft einen logischen Namen (REFFILE) mit dem Pfad der externen CSV-Datei. PROC IMPORT liest diese CSV-Datei und konvertiert sie in ein SAS-Dataset namens WORK.repincome, wobei die erste Zeile als Variablennamen verwendet wird (GETNAMES=YES). PROC CONTENTS zeigt die Metadaten des importierten Datasets an. Schließlich wird %web_open_table verwendet, um die Tabelle in SAS Studio anzuzeigen.
Kopiert!
1%web_drop_table(WORK.repincome);
2 
3FILENAME REFFILE '/home/myFolder/STAT1/RepIncome..csv';
4 
5PROC IMPORT DATAFILE=REFFILE
6 DBMS=CSV
7 OUT=WORK.repincome;
8 GETNAMES=YES;
9RUN;
10 
11PROC CONTENTS DATA=WORK.repincome; RUN;
12 
13%web_open_table(WORK.repincome);
2 Codeblock
PROC SGPLOT
Erklärung :
Dieser Block ist der explorativen Datenvisualisierung gewidmet. Die beiden Aufrufe an PROC SGPLOT erstellen Grafiken: Der erste generiert ein Boxplot (vbox) der Einnahmen ('income') für jeden Kandidaten ('category=candidate'), und der zweite erzeugt ein Streudiagramm (scatter) der Einnahmen ('y=income') in Abhängigkeit vom Kandidaten ('x=candidate'). Diese Grafiken helfen, die Verteilung und die Beziehung zwischen Einnahmen und Kandidaten zu verstehen.
Kopiert!
1PROC SGPLOT DATA=work.repincome;
2vbox income / category=candidate;
3RUN;
4 
5PROC SGPLOT DATA=work.repincome;
6scatter y=income x=candidate;
7RUN;
3 Codeblock
DATA STEP / PROC NPAR1WAY Data
Erklärung :
Dieser Block konzentriert sich auf den Vergleich zwischen 'Trump' und 'Carson'. Ein DATA-Schritt erstellt einen neuen Datensatz 'TrumpCarson', indem 'work.repincome' gefiltert wird, um nur Beobachtungen einzuschließen, bei denen der Kandidatencode nicht '3' ist (wodurch der dritte Kandidat ausgeschlossen wird). Anschließend führt PROC NPAR1WAY einen nicht-parametrischen Wilcoxon-Test für die Variable 'income' durch, wobei 'candidate' als Klassifikationsvariable verwendet wird, mit einem Signifikanzniveau (Alpha) von 0,05. Der exakte Wilcoxon-Test wird angefordert, zusammen mit der Schätzung der Hodges-Lehmann (HL)-Differenz. Ein spezifischer Titel 'Trump Carson' wird dem Ausgabebericht hinzugefügt.
Kopiert!
1*Trump Carson comparison;
2DATA TrumpCarson; SET work.repincome;
3 IF code NE 3;
4RUN;
5 
6PROC NPAR1WAY DATA=TrumpCarson wilcoxon alpha=.05;
7var income;
8class candidate;
9exact wilcoxon HL;
10title 'Trump Carson';
11RUN;
12title;
4 Codeblock
DATA STEP / PROC NPAR1WAY Data
Erklärung :
Ähnlich dem vorherigen Block bereitet dieses Segment die Daten für den Vergleich "Trump" gegen "Cruz" vor und analysiert sie. Ein DATA-Schritt filtert "work.repincome", um "TrumpCruz" zu erstellen, wobei der Kandidat mit dem "Code" "2" ausgeschlossen wird. PROC NPAR1WAY wird dann aufgerufen, um einen Wilcoxon-Test für "income" nach "candidate" durchzuführen, mit denselben Analyseparametern (alpha=0.05, Wilcoxon exakt mit HL). Der Bericht trägt den Titel "Trump Cruz".
Kopiert!
1*Trump Cruz Comparison;
2DATA TrumpCruz; SET work.repincome;
3 IF code NE 2;
4RUN;
5 
6PROC NPAR1WAY DATA=TrumpCruz wilcoxon alpha=.05;
7var income;
8class candidate;
9exact wilcoxon HL;
10title 'Trump Cruz';
11RUN;
12title;
5 Codeblock
DATA STEP / PROC NPAR1WAY Data
Erklärung :
Dieser letzte Block führt den Vergleich zwischen 'Cruz' und 'Carson' durch. Ein Dataset 'CruzCarson' wird erstellt, indem 'work.repincome' gefiltert wird, um den Kandidaten mit dem 'code' '1' auszuschließen. Anschließend wird PROC NPAR1WAY für einen Wilcoxon-Test der Einkommen ('income') der verbleibenden Kandidaten ('candidate') verwendet, wobei dieselben Spezifikationen wie bei den vorherigen Analysen (alpha=0.05, Wilcoxon exakt mit HL) angewendet werden. Der Titel 'Cruz Carson' wird dem Analyseergebnis zugewiesen.
Kopiert!
1*Cruz Carson comparison;
2DATA CruzCarson; SET work.repincome;
3 IF code NE 1;
4RUN;
5 
6PROC NPAR1WAY DATA=CruzCarson wilcoxon alpha=.05;
7var income;
8class candidate;
9exact wilcoxon HL;
10title 'Cruz Carson';
11RUN;
12title;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.

Zugehörige Dokumentation

Aucune documentation spécifique pour cette catégorie.