Das Skript ist eine Reihe von Beispielen für statistische Analysen. Für jedes Beispiel wird zunächst über einen DATA-Schritt mit internen Daten (CARDS) ein Datensatz erstellt. Anschließend werden Visualisierungsprozeduren wie PROC BOXPLOT und PROC SGPLOT verwendet, um die Beziehungen zwischen den Variablen zu untersuchen. Der Kern der Analyse basiert auf PROC GLM (General Linear Models), die verwendet wird, um: 1) Eine ANOVA zur Prüfung des Effekts einer Klassifikationsvariable auf eine Antwortvariable durchzuführen. 2) Eine ANCOVA durchzuführen, um dasselbe zu tun, wobei der Effekt für eine kontinuierliche Variable (Kovariate) angepasst wird. Die angepassten Mittelwerte (LSMEANS) werden berechnet, um die Gruppen zu vergleichen. Dieser Prozess wird für mehrere Datensätze namens medicine, data1, edu, na und sale wiederholt.
Datenanalyse
Type : CREATION_INTERNE
Alle Datensätze (medicine, data1, edu, na, sale) werden direkt im Skript mithilfe von DATA-Schritten und der CARDS/DATALINES-Anweisung erstellt und gefüllt. Es werden keine externen Daten benötigt.
1 Codeblock
DATA STEP Data
Erklärung : Erstellung der Tabelle 'medicine'. Die Option ' @@' in der INPUT-Anweisung weist SAS an, mehrere Beobachtungen aus derselben Datenzeile zu lesen.
INPUT trt x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3
CARDS;
4
127.232.6122.036.6
5
133.037.7126.831.0
6
228.633.8226.530.7
7
226.831.7226.830.4
8
328.635.2322.429.1
9
323.228.9324.430.2
10
429.335.0421.827.0
11
430.336.4424.330.5
12
520.424.6519.623.4
13
525.130.3518.121.8
14
;
15
RUN;
2 Codeblock
PROC SORT
Erklärung : Sortierung des Datensatzes 'medicine' nach der Behandlungsvariablen 'trt'. Dieser Schritt ist oft eine Voraussetzung für 'BY-group'-Analysen.
Kopiert!
proc sort data=medicine;
by trt;
run;
1
PROC SORTDATA=medicine;
2
BY trt;
3
RUN;
3 Codeblock
PROC BOXPLOT
Erklärung : Generierung von Boxplots zur Visualisierung der Verteilung der Variable 'y' für jede Behandlungsgruppe 'trt'.
Kopiert!
proc boxplot data=medicine;
plot y*trt;
run;
1
PROC BOXPLOTDATA=medicine;
2
plot y*trt;
3
RUN;
4 Codeblock
PROC SGPLOT
Erklärung : Erstellung eines Streudiagramms zur Visualisierung der Beziehung zwischen den Variablen 'x' und 'y', wobei die Punkte nach Behandlungsgruppe 'trt' unterschieden werden.
Erklärung : Varianzanalyse (ANOVA). Dieser Block testet, ob sich der Mittelwert der Antwortvariablen 'y' signifikant zwischen den durch 'trt' definierten Gruppen unterscheidet. LSMEANS mit TDIFF vergleicht die Mittelwerte jedes Gruppenpaares.
Kopiert!
PROC GLM data=medicine ;
CLASS trt;
MODEL y=trt /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=medicine ;
2
CLASS trt;
3
MODEL y=trt /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
6 Codeblock
PROC GLM
Erklärung : Kovarianzanalyse (ANCOVA). Dieses Modell testet die Unterschiede in 'y' zwischen den Gruppen 'trt', während der Effekt der kontinuierlichen Kovariaten 'x' kontrolliert wird.
Kopiert!
PROC GLM data=medicine ;
CLASS trt;
MODEL y=trt x /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=medicine ;
2
CLASS trt;
3
MODEL y=trt x /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
7 Codeblock
DATA STEP Data
Erklärung : Erstellung eines zweiten Datensatzes 'data1' mit einer textuellen Behandlungsvariablen ('A', 'B') und zwei numerischen Variablen.
Kopiert!
data data1;
input trt $ x y;
cards;
A 5 20
A 10 23
A 12 30
A 9 25
A 23 34
A 21 40
A 14 27
A 18 38
A 6 24
A 13 31
B 7 19
B 12 26
B 27 33
B 24 35
B 18 30
B 22 31
B 26 34
B 21 28
B 14 23
B 9 22
;
RUN;
1
DATA data1;
2
INPUT trt $ x y;
3
CARDS;
4
A 520
5
A 1023
6
A 1230
7
A 925
8
A 2334
9
A 2140
10
A 1427
11
A 1838
12
A 624
13
A 1331
14
B 719
15
B 1226
16
B 2733
17
B 2435
18
B 1830
19
B 2231
20
B 2634
21
B 2128
22
B 1423
23
B 922
24
;
25
RUN;
8 Codeblock
PROC GLM
Erklärung : Durchführung einer Kovarianzanalyse (ANCOVA) auf dem Datensatz 'data1', um den Effekt von 'trt' auf 'y' unter Berücksichtigung von 'x' zu bewerten.
Kopiert!
PROC GLM data=data1 ;
CLASS trt;
MODEL y=trt x /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=data1 ;
2
CLASS trt;
3
MODEL y=trt x /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
9 Codeblock
DATA STEP Data
Erklärung : Erstellung des Datensatzes 'edu' zum Vergleich verschiedener Methoden. Die Option ' @@' ermöglicht das Lesen mehrerer Beobachtungen pro Zeile.
INPUT method x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3
CARDS;
4
12939143411836
5
21735235382332
6
31383154333244
7
;
8
RUN;
10 Codeblock
PROC GLM
Erklärung : Kovarianzanalyse (ANCOVA) der Tabelle 'edu', um den Effekt der 'method' auf 'y' unter Kontrolle von 'x' zu vergleichen.
Kopiert!
PROC GLM data=edu ;
CLASS method;
MODEL y=method x /SOLUTION;
LSMEANS method/TDIFF;
RUN;
1
PROC GLMDATA=edu ;
2
CLASS method;
3
MODEL y=method x /SOLUTION;
4
LSMEANS method/TDIFF;
5
RUN;
11 Codeblock
DATA STEP Data
Erklärung : Erstellung der Tabelle 'na' mit drei Behandlungsgruppen (A, B, C).
Kopiert!
DATA na;
input trt $ x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
cards;
A 11 6 A 8 0 A 5 2 A 14 8 A 19 11 A 6 4 A 10 13 A 6 1 A 11 8 A 3 0
B 6 0 B 6 2 B 7 3 B 8 1 B 18 18 B 8 4 B 19 14 B 8 9 B 5 1 B 15 9
C 16 13 C 13 10 C 11 18 C 9 5 C 21 23 C 16 12 C 12 5 C 12 16 C 7 1 C 12 20
;
RUN;
1
DATA na;
2
INPUT trt $ x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3
CARDS;
4
A 116 A 8 0 A 52 A 148 A 1911 A 64 A 1013 A 61 A 118 A 3 0
5
B 6 0 B 62 B 73 B 81 B 1818 B 84 B 1914 B 89 B 51 B 159
6
C 1613 C 1310 C 1118 C 95 C 2123 C 1612 C 125 C 1216 C 71 C 1220
7
;
8
RUN;
12 Codeblock
PROC GLM
Erklärung : Kovarianzanalyse (ANCOVA) der Daten 'na'.
Kopiert!
PROC GLM data=na ;
CLASS trt;
MODEL y=trt x /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=na ;
2
CLASS trt;
3
MODEL y=trt x /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
13 Codeblock
DATA STEP Data
Erklärung : Erstellung des letzten Beispieldatensatzes 'sale'.
INPUT type x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3
CARDS;
4
1382113926136221452813319
5
2433423826238292271823425
6
3242333229331303211632829
7
;
8
RUN;
14 Codeblock
PROC GLM
Erklärung : Finale Kovarianzanalyse der Tabelle 'sale', um den Effekt des 'type' auf 'y' unter Berücksichtigung der Kovariaten 'x' zu bewerten.
Kopiert!
PROC GLM data=sale ;
CLASS type;
MODEL y=type x /SOLUTION;
LSMEANS type/TDIFF;
RUN;
1
PROC GLMDATA=sale ;
2
CLASS type;
3
MODEL y=type x /SOLUTION;
4
LSMEANS type/TDIFF;
5
RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.