Veröffentlicht am :
Statistique CREATION_INTERNE

Varianzanalyse (ANOVA) und Kovarianzanalyse (ANCOVA)

Dieser Code ist auch verfügbar auf: English Français
Wartet auf Validierung
Das Skript ist eine Reihe von Beispielen für statistische Analysen. Für jedes Beispiel wird zunächst über einen DATA-Schritt mit internen Daten (CARDS) ein Datensatz erstellt. Anschließend werden Visualisierungsprozeduren wie PROC BOXPLOT und PROC SGPLOT verwendet, um die Beziehungen zwischen den Variablen zu untersuchen. Der Kern der Analyse basiert auf PROC GLM (General Linear Models), die verwendet wird, um: 1) Eine ANOVA zur Prüfung des Effekts einer Klassifikationsvariable auf eine Antwortvariable durchzuführen. 2) Eine ANCOVA durchzuführen, um dasselbe zu tun, wobei der Effekt für eine kontinuierliche Variable (Kovariate) angepasst wird. Die angepassten Mittelwerte (LSMEANS) werden berechnet, um die Gruppen zu vergleichen. Dieser Prozess wird für mehrere Datensätze namens medicine, data1, edu, na und sale wiederholt.
Datenanalyse

Type : CREATION_INTERNE


Alle Datensätze (medicine, data1, edu, na, sale) werden direkt im Skript mithilfe von DATA-Schritten und der CARDS/DATALINES-Anweisung erstellt und gefüllt. Es werden keine externen Daten benötigt.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellung der Tabelle 'medicine'. Die Option ' @@' in der INPUT-Anweisung weist SAS an, mehrere Beobachtungen aus derselben Datenzeile zu lesen.
Kopiert!
1DATA medicine;
2INPUT trt x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3CARDS;
41 27.2 32.6 1 22.0 36.6
51 33.0 37.7 1 26.8 31.0
62 28.6 33.8 2 26.5 30.7
72 26.8 31.7 2 26.8 30.4
83 28.6 35.2 3 22.4 29.1
93 23.2 28.9 3 24.4 30.2
104 29.3 35.0 4 21.8 27.0
114 30.3 36.4 4 24.3 30.5
125 20.4 24.6 5 19.6 23.4
135 25.1 30.3 5 18.1 21.8
14;
15RUN;
2 Codeblock
PROC SORT
Erklärung :
Sortierung des Datensatzes 'medicine' nach der Behandlungsvariablen 'trt'. Dieser Schritt ist oft eine Voraussetzung für 'BY-group'-Analysen.
Kopiert!
1PROC SORT DATA=medicine;
2 BY trt;
3RUN;
3 Codeblock
PROC BOXPLOT
Erklärung :
Generierung von Boxplots zur Visualisierung der Verteilung der Variable 'y' für jede Behandlungsgruppe 'trt'.
Kopiert!
1PROC BOXPLOT DATA=medicine;
2 plot y*trt;
3RUN;
4 Codeblock
PROC SGPLOT
Erklärung :
Erstellung eines Streudiagramms zur Visualisierung der Beziehung zwischen den Variablen 'x' und 'y', wobei die Punkte nach Behandlungsgruppe 'trt' unterschieden werden.
Kopiert!
1 
2PROC SGPLOT
3DATA=medicine;
4scatter x=x y=y / group=trt;
5RUN;
6 
5 Codeblock
PROC GLM
Erklärung :
Varianzanalyse (ANOVA). Dieser Block testet, ob sich der Mittelwert der Antwortvariablen 'y' signifikant zwischen den durch 'trt' definierten Gruppen unterscheidet. LSMEANS mit TDIFF vergleicht die Mittelwerte jedes Gruppenpaares.
Kopiert!
1PROC GLM DATA=medicine ;
2CLASS trt;
3MODEL y=trt /SOLUTION;
4LSMEANS trt/TDIFF;
5RUN;
6 Codeblock
PROC GLM
Erklärung :
Kovarianzanalyse (ANCOVA). Dieses Modell testet die Unterschiede in 'y' zwischen den Gruppen 'trt', während der Effekt der kontinuierlichen Kovariaten 'x' kontrolliert wird.
Kopiert!
1PROC GLM DATA=medicine ;
2CLASS trt;
3MODEL y=trt x /SOLUTION;
4LSMEANS trt/TDIFF;
5RUN;
7 Codeblock
DATA STEP Data
Erklärung :
Erstellung eines zweiten Datensatzes 'data1' mit einer textuellen Behandlungsvariablen ('A', 'B') und zwei numerischen Variablen.
Kopiert!
1DATA data1;
2 INPUT trt $ x y;
3 CARDS;
4A 5 20
5A 10 23
6A 12 30
7A 9 25
8A 23 34
9A 21 40
10A 14 27
11A 18 38
12A 6 24
13A 13 31
14B 7 19
15B 12 26
16B 27 33
17B 24 35
18B 18 30
19B 22 31
20B 26 34
21B 21 28
22B 14 23
23B 9 22
24;
25RUN;
8 Codeblock
PROC GLM
Erklärung :
Durchführung einer Kovarianzanalyse (ANCOVA) auf dem Datensatz 'data1', um den Effekt von 'trt' auf 'y' unter Berücksichtigung von 'x' zu bewerten.
Kopiert!
1PROC GLM DATA=data1 ;
2CLASS trt;
3MODEL y=trt x /SOLUTION;
4LSMEANS trt/TDIFF;
5RUN;
9 Codeblock
DATA STEP Data
Erklärung :
Erstellung des Datensatzes 'edu' zum Vergleich verschiedener Methoden. Die Option ' @@' ermöglicht das Lesen mehrerer Beobachtungen pro Zeile.
Kopiert!
1DATA edu;
2 INPUT method x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 CARDS;
41 29 39 1 4 34 1 18 36
52 17 35 2 35 38 2 3 32
63 1 38 3 15 43 3 32 44
7;
8RUN;
10 Codeblock
PROC GLM
Erklärung :
Kovarianzanalyse (ANCOVA) der Tabelle 'edu', um den Effekt der 'method' auf 'y' unter Kontrolle von 'x' zu vergleichen.
Kopiert!
1PROC GLM DATA=edu ;
2CLASS method;
3MODEL y=method x /SOLUTION;
4LSMEANS method/TDIFF;
5RUN;
11 Codeblock
DATA STEP Data
Erklärung :
Erstellung der Tabelle 'na' mit drei Behandlungsgruppen (A, B, C).
Kopiert!
1DATA na;
2INPUT trt $ x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3CARDS;
4A 11 6 A 8 0 A 5 2 A 14 8 A 19 11 A 6 4 A 10 13 A 6 1 A 11 8 A 3 0
5B 6 0 B 6 2 B 7 3 B 8 1 B 18 18 B 8 4 B 19 14 B 8 9 B 5 1 B 15 9
6C 16 13 C 13 10 C 11 18 C 9 5 C 21 23 C 16 12 C 12 5 C 12 16 C 7 1 C 12 20
7;
8RUN;
12 Codeblock
PROC GLM
Erklärung :
Kovarianzanalyse (ANCOVA) der Daten 'na'.
Kopiert!
1PROC GLM DATA=na ;
2CLASS trt;
3MODEL y=trt x /SOLUTION;
4LSMEANS trt/TDIFF;
5RUN;
13 Codeblock
DATA STEP Data
Erklärung :
Erstellung des letzten Beispieldatensatzes 'sale'.
Kopiert!
1DATA sale;
2INPUT type x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3CARDS;
41 38 21 1 39 26 1 36 22 1 45 28 1 33 19
52 43 34 2 38 26 2 38 29 2 27 18 2 34 25
63 24 23 3 32 29 3 31 30 3 21 16 3 28 29
7;
8RUN;
14 Codeblock
PROC GLM
Erklärung :
Finale Kovarianzanalyse der Tabelle 'sale', um den Effekt des 'type' auf 'y' unter Berücksichtigung der Kovariaten 'x' zu bewerten.
Kopiert!
1PROC GLM DATA=sale ;
2CLASS type;
3MODEL y=type x /SOLUTION;
4LSMEANS type/TDIFF;
5RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.