Veröffentlicht am :
Statistik CREATION_INTERNE

Analyse von Überdispersion in der Teratologie

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Die Analyse beginnt mit der internen Erstellung eines 'teratology'-Datensatzes. Die Variablen 'litter', 'group', 'n' (Gesamtzahl der Beobachtungen) und 'y' (Anzahl der Erfolge) werden eingelesen. Indikatorvariablen (z2, z3, z4) werden für die Gruppen 2, 3 und 4 entsprechend generiert. Anschließend wird eine PROC LOGISTIC verwendet, um ein logistisches Regressionsmodell auf das Verhältnis y/n mit den Indikatorvariablen als Prädiktoren anzupassen, ohne anfängliche Skalenkorrektur. Schließlich wird eine PROC NLMIXED eingesetzt, um ein nicht-lineares gemischtes Modell anzupassen, das die binäre Antwort mit einem Zufallseffekt ('u') pro Wurf ('litter') modelliert, um die Überdispersion zu erfassen, indem die Parameter Alpha, Beta2, Beta3, Beta4 und Sigma geschätzt werden.
Datenanalyse

Type : CREATION_INTERNE


Die Daten sind direkt über die 'cards'-Anweisung im DATA-Schritt in das SAS-Skript integriert, was bedeutet, dass sie intern erstellt werden und nicht von externen Quellen oder SASHELP-Bibliotheken abhängen.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA-Schritt erstellt einen Datensatz namens 'teratology'. Die Variablen 'litter' (Wurf), 'group' (Behandlungsgruppe), 'n' (Gesamtzahl der Individuen) und 'y' (Anzahl der betroffenen Individuen) werden aus den Datenzeilen ('cards') gelesen. Drei Indikatorvariablen, z2, z3 und z4, werden erstellt, um die Behandlungsgruppen 2, 3 und 4 darzustellen. Wenn die Variable 'group' gleich 2 ist, nimmt z2 den Wert 1 an, sonst 0. Das gleiche Prinzip gilt für z3 (group=3) und z4 (group=4), was die Einbeziehung der Gruppen in die statistischen Modelle erleichtert.
Kopiert!
1DATA teratology;
2 INPUT litter group n y ;
3 z2=0; z3=0; z4=0;
4 IF group=2 THEN z2=1; IF group=3 THEN z3=1; IF group=4 THEN z4=1;
5CARDS;
6 1 1 10 1
7 2 1 11 4
8 3 1 12 9
9 4 1 4 4
10 5 1 10 10
11 6 1 11 9
12 7 1 9 9
13 8 1 11 11
14 9 1 10 10
15 10 1 10 7
16 11 1 12 12
17 12 1 10 9
18 13 1 8 8
19 14 1 11 9
20 15 1 6 4
21 16 1 9 7
22 17 1 14 14
23 18 1 12 7
24 19 1 11 9
25 20 1 13 8
26 21 1 14 5
27 22 1 10 10
28 23 1 12 10
29 24 1 13 8
30 25 1 10 10
31 26 1 14 3
32 27 1 13 13
33 28 1 4 3
34 29 1 8 8
35 30 1 13 5
36 31 1 12 12
37 32 2 10 1
38 33 2 3 1
39 34 2 13 1
40 35 2 12 0
41 36 2 14 4
42 37 2 9 2
43 38 2 13 2
44 39 2 16 1
45 40 2 11 0
46 41 2 4 0
47 42 2 1 0
48 43 2 12 0
49 44 3 8 0
50 45 3 11 1
51 46 3 14 0
52 47 3 14 1
53 48 3 11 0
54 49 4 3 0
55 50 4 13 0
56 51 4 9 2
57 52 4 17 2
58 53 4 15 0
59 54 4 2 0
60 55 4 14 1
61 56 4 8 0
62 57 4 6 0
63 58 4 17 0
64;
2 Codeblock
PROC LOGISTIC
Erklärung :
Die PROC LOGISTIC wird verwendet, um ein logistisches Regressionsmodell anzupassen. Die Klausel 'model y/n' gibt eine binäre Antwortvariable an, wobei 'y' die Anzahl der 'Erfolge' und 'n' die Gesamtzahl der Versuche ist. Die Variablen z2, z3 und z4 sind die Prädiktoren. Die Option 'scale=none' wird angegeben, um die automatische Skalierungsanpassung zu vermeiden, was bei der Untersuchung von Überdispersion relevant ist.
Kopiert!
1 
2PROC LOGISTIC;
3 
4model y/n = z2 z3 z4 / scale=none;
5 
3 Codeblock
PROC NLMIXED
Erklärung :
Die PROC NLMIXED wird verwendet, um ein nicht-lineares gemischtes Modell anzupassen. Die Option 'qpoints=30' gibt die Anzahl der Quadraturpunkte für die numerische Integration an. Die Gleichungen 'eta' und 'p' definieren den linearen Teil und die Wahrscheinlichkeit (über die inverse Logit-Funktion) des Modells. Die Klausel 'model y ~ binomial(n,p)' gibt an, dass 'y' einer Binomialverteilung mit 'n' Versuchen und einer Wahrscheinlichkeit 'p' folgt. Ein Zufallseffekt 'u' ist enthalten und wird angenommen, einer Normalverteilung mit einem Mittelwert von 0 und einer Varianz von 'sigma*sigma' zu folgen, gruppiert nach 'litter' (Wurf), was die Modellierung von Überdispersion unter Berücksichtigung der Variabilität zwischen den Würfen ermöglicht.
Kopiert!
1PROC NLMIXED qpoints=30;
2 eta = alpha + beta2*z2 + beta3*z3 + beta4*z4 + u ;
3 p = exp(eta)/(1 + exp(eta));
4 model y ~ binomial(n,p) ;
5 random u ~ normal(0, sigma*sigma) subject=litter;
6RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.