Varianzanalyse (ANOVA) und Kovarianzanalyse (ANCOVA)

Das Skript ist eine Reihe von Beispielen für statistische Analysen. Für jedes Beispiel wird zunächst über einen DATA-Schritt mit internen Daten (CARDS) ein Datensatz erstellt. Anschließend werden Visualisierungsprozeduren wie PROC BOXPLOT und PROC SGPLOT verwendet, um die Beziehungen zwischen den Variablen zu untersuchen. Der Kern der Analyse basiert auf PROC GLM (General Linear Models), die verwendet wird, um: 1) Eine ANOVA zur Prüfung des Effekts einer Klassifikationsvariable auf eine Antwortvariable durchzuführen. 2) Eine ANCOVA durchzuführen, um dasselbe zu tun, wobei der Effekt für eine kontinuierliche Variable (Kovariate) angepasst wird. Die angepassten Mittelwerte (LSMEANS) werden berechnet, um die Gruppen zu vergleichen. Dieser Prozess wird für mehrere Datensätze namens medicine, data1, edu, na und sale wiederholt.

Datenanalyse

Type : CREATION_INTERNE

Alle Datensätze (medicine, data1, edu, na, sale) werden direkt im Skript mithilfe von DATA-Schritten und der CARDS/DATALINES-Anweisung erstellt und gefüllt. Es werden keine externen Daten benötigt.

1 Codeblock

DATA STEP Data

Erklärung :
Erstellung der Tabelle 'medicine'. Die Option ' @@' in der INPUT-Anweisung weist SAS an, mehrere Beobachtungen aus derselben Datenzeile zu lesen.

Kopiert!

1	DATA medicine;
2	INPUT trt x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3	CARDS;
4	1 27.2 32.6 1 22.0 36.6
5	1 33.0 37.7 1 26.8 31.0
6	2 28.6 33.8 2 26.5 30.7
7	2 26.8 31.7 2 26.8 30.4
8	3 28.6 35.2 3 22.4 29.1
9	3 23.2 28.9 3 24.4 30.2
10	4 29.3 35.0 4 21.8 27.0
11	4 30.3 36.4 4 24.3 30.5
12	5 20.4 24.6 5 19.6 23.4
13	5 25.1 30.3 5 18.1 21.8
14	;
15	RUN;

2 Codeblock

PROC SORT

Erklärung :
Sortierung des Datensatzes 'medicine' nach der Behandlungsvariablen 'trt'. Dieser Schritt ist oft eine Voraussetzung für 'BY-group'-Analysen.

Kopiert!

1	PROC SORT DATA=medicine;
2	BY trt;
3	RUN;

3 Codeblock

PROC BOXPLOT

Erklärung :
Generierung von Boxplots zur Visualisierung der Verteilung der Variable 'y' für jede Behandlungsgruppe 'trt'.

Kopiert!

1	PROC BOXPLOT DATA=medicine;
2	plot y*trt;
3	RUN;

4 Codeblock

PROC SGPLOT

Erklärung :
Erstellung eines Streudiagramms zur Visualisierung der Beziehung zwischen den Variablen 'x' und 'y', wobei die Punkte nach Behandlungsgruppe 'trt' unterschieden werden.

Kopiert!

1
2	PROC SGPLOT
3	DATA=medicine;
4	scatter x=x y=y / group=trt;
5	RUN;
6

5 Codeblock

PROC GLM

Erklärung :
Varianzanalyse (ANOVA). Dieser Block testet, ob sich der Mittelwert der Antwortvariablen 'y' signifikant zwischen den durch 'trt' definierten Gruppen unterscheidet. LSMEANS mit TDIFF vergleicht die Mittelwerte jedes Gruppenpaares.

Kopiert!

1	PROC GLM DATA=medicine ;
2	CLASS trt;
3	MODEL y=trt /SOLUTION;
4	LSMEANS trt/TDIFF;
5	RUN;

6 Codeblock

PROC GLM

Erklärung :
Kovarianzanalyse (ANCOVA). Dieses Modell testet die Unterschiede in 'y' zwischen den Gruppen 'trt', während der Effekt der kontinuierlichen Kovariaten 'x' kontrolliert wird.

Kopiert!

1	PROC GLM DATA=medicine ;
2	CLASS trt;
3	MODEL y=trt x /SOLUTION;
4	LSMEANS trt/TDIFF;
5	RUN;

7 Codeblock

DATA STEP Data

Erklärung :
Erstellung eines zweiten Datensatzes 'data1' mit einer textuellen Behandlungsvariablen ('A', 'B') und zwei numerischen Variablen.

Kopiert!

1	DATA data1;
2	INPUT trt $ x y;
3	CARDS;
4	A 5 20
5	A 10 23
6	A 12 30
7	A 9 25
8	A 23 34
9	A 21 40
10	A 14 27
11	A 18 38
12	A 6 24
13	A 13 31
14	B 7 19
15	B 12 26
16	B 27 33
17	B 24 35
18	B 18 30
19	B 22 31
20	B 26 34
21	B 21 28
22	B 14 23
23	B 9 22
24	;
25	RUN;

8 Codeblock

PROC GLM

Erklärung :
Durchführung einer Kovarianzanalyse (ANCOVA) auf dem Datensatz 'data1', um den Effekt von 'trt' auf 'y' unter Berücksichtigung von 'x' zu bewerten.

Kopiert!

1	PROC GLM DATA=data1 ;
2	CLASS trt;
3	MODEL y=trt x /SOLUTION;
4	LSMEANS trt/TDIFF;
5	RUN;

9 Codeblock

DATA STEP Data

Erklärung :
Erstellung des Datensatzes 'edu' zum Vergleich verschiedener Methoden. Die Option ' @@' ermöglicht das Lesen mehrerer Beobachtungen pro Zeile.

Kopiert!

1	DATA edu;
2	INPUT method x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3	CARDS;
4	1 29 39 1 4 34 1 18 36
5	2 17 35 2 35 38 2 3 32
6	3 1 38 3 15 43 3 32 44
7	;
8	RUN;

10 Codeblock

PROC GLM

Erklärung :
Kovarianzanalyse (ANCOVA) der Tabelle 'edu', um den Effekt der 'method' auf 'y' unter Kontrolle von 'x' zu vergleichen.

Kopiert!

1	PROC GLM DATA=edu ;
2	CLASS method;
3	MODEL y=method x /SOLUTION;
4	LSMEANS method/TDIFF;
5	RUN;

11 Codeblock

DATA STEP Data

Erklärung :
Erstellung der Tabelle 'na' mit drei Behandlungsgruppen (A, B, C).

Kopiert!

1	DATA na;
2	INPUT trt $ x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3	CARDS;
4	A 11 6 A 8 0 A 5 2 A 14 8 A 19 11 A 6 4 A 10 13 A 6 1 A 11 8 A 3 0
5	B 6 0 B 6 2 B 7 3 B 8 1 B 18 18 B 8 4 B 19 14 B 8 9 B 5 1 B 15 9
6	C 16 13 C 13 10 C 11 18 C 9 5 C 21 23 C 16 12 C 12 5 C 12 16 C 7 1 C 12 20
7	;
8	RUN;

12 Codeblock

PROC GLM

Erklärung :
Kovarianzanalyse (ANCOVA) der Daten 'na'.

Kopiert!

1	PROC GLM DATA=na ;
2	CLASS trt;
3	MODEL y=trt x /SOLUTION;
4	LSMEANS trt/TDIFF;
5	RUN;

13 Codeblock

DATA STEP Data

Erklärung :
Erstellung des letzten Beispieldatensatzes 'sale'.

Kopiert!

1	DATA sale;
2	INPUT type x y @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3	CARDS;
4	1 38 21 1 39 26 1 36 22 1 45 28 1 33 19
5	2 43 34 2 38 26 2 38 29 2 27 18 2 34 25
6	3 24 23 3 32 29 3 31 30 3 21 16 3 28 29
7	;
8	RUN;

14 Codeblock

PROC GLM

Erklärung :
Finale Kovarianzanalyse der Tabelle 'sale', um den Effekt des 'type' auf 'y' unter Berücksichtigung der Kovariaten 'x' zu bewerten.

Kopiert!

1	PROC GLM DATA=sale ;
2	CLASS type;
3	MODEL y=type x /SOLUTION;
4	LSMEANS type/TDIFF;
5	RUN;

Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.

Retour à la liste