Dean (1992) Score Test Statistik

Das Skript beginnt mit der Erstellung eines internen Datasets 'toxoplasmosis' über einen DATA STEP und Datalines, einschließlich Variablen für die Anzahl der Erfolge (t), die Gesamtzahl der Versuche (m) und eine Variable 'rain' (Regen), die in 'z' kopiert wird. Anschließend wird die Variable 'z' mit PROC STDIZE standardisiert. Eine PROC GLIMMIX wird verwendet, um ein verallgemeinertes lineares gemischtes Modell mit einem Logit-Link und einer Binomialverteilung anzupassen, wobei 't/m' als Funktion von 'z', 'z*z' und 'z*z*z' modelliert wird. Die Modellvorhersagen werden für die Berechnung der Score-Statistik exportiert. Ein nachfolgender DATA STEP berechnet die für den Test erforderlichen Zwischenterme. PROC MEANS aggregiert diese Terme, und ein letzter DATA STEP berechnet die Z-Statistik des Score-Tests und den zugehörigen p-Wert. Schließlich zeigt PROC PRINT die Ergebnisse in einer formatierten HTML-Ausgabe an.

Datenanalyse

Type : CREATION_INTERNE

Die Daten werden direkt im Skript über einen DATA STEP und 'datalines' erstellt.

1 Codeblock

DATA STEP Data

Erklärung :
Dieser DATA STEP-Block erstellt das Dataset 'toxoplasmosis', indem Rohdaten (t, m, rain) direkt aus den 'datalines' gelesen werden. Eine neue Variable 'z' wird als Kopie der Variablen 'rain' erstellt.

Kopiert!

1	DATA toxoplasmosis;
2	INPUT t m rain;
3	z = rain;
4	DATALINES;
5	2 4 1735
6	3 10 1936
7	1 5 2000
8	3 10 1973
9	2 2 1750
10	3 5 1800
11	2 8 1750
12	7 19 2077
13	3 6 1920
14	8 10 1800
15	7 24 2050
16	0 1 1830
17	15 30 1650
18	4 22 2200
19	0 1 2000
20	6 11 1770
21	0 1 1920
22	33 54 1770
23	4 9 2240
24	5 18 1620
25	2 12 1756
26	0 1 1650
27	8 11 2250
28	41 77 1796
29	24 51 1890
30	7 16 1871
31	46 82 2063
32	9 13 2100
33	23 43 1918
34	53 75 1834
35	8 13 1780
36	3 10 1900
37	1 6 1976
38	23 37 2292
39	;

2 Codeblock

PROC STDIZE

Erklärung :
Diese Prozedur standardisiert die Variable 'z' im Dataset 'toxoplasmosis'. Das Ausgabedataset überschreibt das Original, um sicherzustellen, dass nachfolgende Berechnungen die standardisierte Version von 'z' verwenden.

Kopiert!

1
2	PROC STDIZE
3	DATA=toxoplasmosis out=toxoplasmosis;
4	var z;
5
6	RUN;
7

3 Codeblock

PROC GLIMMIX

Erklärung :
PROC GLIMMIX wird verwendet, um ein verallgemeinertes lineares gemischtes Modell anzupassen. Das Modell spezifiziert eine binomiale Antwort (t/m), eine Logit-Link-Funktion und enthält 'z', 'z*z' und 'z*z*z' als Prädiktoren. Die Option 's' fordert Zusammenfassungsstatistiken an. Die 'output'-Klausel erstellt ein neues Dataset 'pdata', das die vorhergesagten Wahrscheinlichkeiten ('pi') ohne Zufallseffekte (noblup) und auf der Antwortskala (ilink) enthält.

Kopiert!

1	ods select none;
2	PROC GLIMMIX DATA=toxoplasmosis;
3	model t/m = z zz zz*z / link=logit dist=bin s;
4	OUTPUT out=pdata pred(noblup ilink) = pi;
5	RUN;
6	ods select all;

4 Codeblock

DATA STEP

Erklärung :
Dieser DATA STEP liest das Dataset 'pdata' (erstellt von GLIMMIX) und berechnet mehrere Zwischenvariablen ('pic', 'pipic', 'mpi', 't_mpi', 'pit_mpi', 'tpic', 'mm_1', 'aux'), die für die Formel der Dean'schen Score-Test-Statistik erforderlich sind. Nur 'aux' und 'mm_1' werden für spätere Schritte beibehalten.

Kopiert!

1	DATA pdata;
2	SET pdata;
3	pic = 1 - pi;
4	pipic = pi * pic;
5	mpi = m * pi;
6	t_mpi = t - mpi;
7	pit_mpi = pi * t_mpi;
8	tpic = t * pic;
9	mm_1 = m * (m-1);
10	aux = ( t_mpi*t_mpi + pit_mpi - tpic ) / pipic;
11	keep aux mm_1;
12	RUN;

5 Codeblock

PROC MEANS

Erklärung :
PROC MEANS wird hier verwendet, um die Summe der Variablen 'aux' und 'mm_1' über das gesamte Dataset 'pdata' zu berechnen. Das Ergebnis wird in einem neuen Dataset namens 'new' gespeichert, und die Option 'noprint' unterdrückt die Anzeige der Standardausgabe von PROC MEANS.

Kopiert!

1	PROC MEANS DATA=pdata sum noprint;
2	var aux mm_1;
3	OUTPUT out=new sum=aux mm_1;
4	RUN;

6 Codeblock

DATA STEP

Erklärung :
Dieser DATA STEP liest das Dataset 'new' (das die Summen von 'aux' und 'mm_1' enthält) und berechnet die Z-Statistik des Score-Tests sowie den zugehörigen p-Wert ('pval'). Formate und Beschriftungen werden auf die Variablen angewendet, um eine bessere Darstellung zu ermöglichen.

Kopiert!

1	DATA new;
2	SET new;
3	label Z = "GOF Test";
4	label PVal = "P-Value";
5	FORMAT Z 8.2 Pval pvalue6.;
6	z = aux / sqrt( 2*mm_1 );
7	pval = 1 - probnorm( z );
8	RUN;

7 Codeblock

PROC PRINT

Erklärung :
Dieser Block generiert die Endausgabe. ODS HTML wird aktiviert, um die Ausgabe in eine HTML-Datei (oder die SAS Studio-Umgebung) umzuleiten. Ein Titel wird definiert. PROC PRINT wird verwendet, um die Variablen 'z' (Teststatistik) und 'pval' (p-Wert) aus dem Dataset 'new' anzuzeigen. Die Optionen 'noobs' unterdrücken die Beobachtungsnummer und 'label' verwendet die definierten Beschriftungen für die Spaltenüberschriften. ODS HTML wird anschließend geschlossen.

Kopiert!

1	ods html;
2	title "Score Test Statistic, Dean (1992)";
3	PROC PRINT DATA=new noobs label;
4	var z pval;
5	RUN;
6	ods html close;

Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.

Urheberrechtsinformationen : Score Test Statistic, Dean (1992). Example from Efron (1978, 1986).

Retour à la liste