Veröffentlicht am :
Statistik CREATION_INTERNE

Dean (1992) Score Test Statistik

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript beginnt mit der Erstellung eines internen Datasets 'toxoplasmosis' über einen DATA STEP und Datalines, einschließlich Variablen für die Anzahl der Erfolge (t), die Gesamtzahl der Versuche (m) und eine Variable 'rain' (Regen), die in 'z' kopiert wird. Anschließend wird die Variable 'z' mit PROC STDIZE standardisiert. Eine PROC GLIMMIX wird verwendet, um ein verallgemeinertes lineares gemischtes Modell mit einem Logit-Link und einer Binomialverteilung anzupassen, wobei 't/m' als Funktion von 'z', 'z*z' und 'z*z*z' modelliert wird. Die Modellvorhersagen werden für die Berechnung der Score-Statistik exportiert. Ein nachfolgender DATA STEP berechnet die für den Test erforderlichen Zwischenterme. PROC MEANS aggregiert diese Terme, und ein letzter DATA STEP berechnet die Z-Statistik des Score-Tests und den zugehörigen p-Wert. Schließlich zeigt PROC PRINT die Ergebnisse in einer formatierten HTML-Ausgabe an.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden direkt im Skript über einen DATA STEP und 'datalines' erstellt.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP-Block erstellt das Dataset 'toxoplasmosis', indem Rohdaten (t, m, rain) direkt aus den 'datalines' gelesen werden. Eine neue Variable 'z' wird als Kopie der Variablen 'rain' erstellt.
Kopiert!
1 DATA toxoplasmosis;
2 INPUT t m rain;
3 z = rain;
4 DATALINES;
5 2 4 1735
6 3 10 1936
7 1 5 2000
8 3 10 1973
9 2 2 1750
10 3 5 1800
11 2 8 1750
12 7 19 2077
13 3 6 1920
14 8 10 1800
15 7 24 2050
16 0 1 1830
17 15 30 1650
18 4 22 2200
19 0 1 2000
20 6 11 1770
21 0 1 1920
22 33 54 1770
23 4 9 2240
24 5 18 1620
25 2 12 1756
26 0 1 1650
27 8 11 2250
28 41 77 1796
29 24 51 1890
30 7 16 1871
31 46 82 2063
32 9 13 2100
33 23 43 1918
34 53 75 1834
35 8 13 1780
36 3 10 1900
37 1 6 1976
38 23 37 2292
39 ;
2 Codeblock
PROC STDIZE
Erklärung :
Diese Prozedur standardisiert die Variable 'z' im Dataset 'toxoplasmosis'. Das Ausgabedataset überschreibt das Original, um sicherzustellen, dass nachfolgende Berechnungen die standardisierte Version von 'z' verwenden.
Kopiert!
1 
2PROC STDIZE
3DATA=toxoplasmosis out=toxoplasmosis;
4var z;
5 
6RUN;
7 
3 Codeblock
PROC GLIMMIX
Erklärung :
PROC GLIMMIX wird verwendet, um ein verallgemeinertes lineares gemischtes Modell anzupassen. Das Modell spezifiziert eine binomiale Antwort (t/m), eine Logit-Link-Funktion und enthält 'z', 'z*z' und 'z*z*z' als Prädiktoren. Die Option 's' fordert Zusammenfassungsstatistiken an. Die 'output'-Klausel erstellt ein neues Dataset 'pdata', das die vorhergesagten Wahrscheinlichkeiten ('pi') ohne Zufallseffekte (noblup) und auf der Antwortskala (ilink) enthält.
Kopiert!
1 ods select none;
2 PROC GLIMMIX DATA=toxoplasmosis;
3 model t/m = z z*z z*z*z / link=logit dist=bin s;
4 OUTPUT out=pdata pred(noblup ilink) = pi;
5 RUN;
6 ods select all;
4 Codeblock
DATA STEP
Erklärung :
Dieser DATA STEP liest das Dataset 'pdata' (erstellt von GLIMMIX) und berechnet mehrere Zwischenvariablen ('pic', 'pipic', 'mpi', 't_mpi', 'pit_mpi', 'tpic', 'mm_1', 'aux'), die für die Formel der Dean'schen Score-Test-Statistik erforderlich sind. Nur 'aux' und 'mm_1' werden für spätere Schritte beibehalten.
Kopiert!
1 DATA pdata;
2 SET pdata;
3 pic = 1 - pi;
4 pipic = pi * pic;
5 mpi = m * pi;
6 t_mpi = t - mpi;
7 pit_mpi = pi * t_mpi;
8 tpic = t * pic;
9 mm_1 = m * (m-1);
10 aux = ( t_mpi*t_mpi + pit_mpi - tpic ) / pipic;
11 keep aux mm_1;
12 RUN;
5 Codeblock
PROC MEANS
Erklärung :
PROC MEANS wird hier verwendet, um die Summe der Variablen 'aux' und 'mm_1' über das gesamte Dataset 'pdata' zu berechnen. Das Ergebnis wird in einem neuen Dataset namens 'new' gespeichert, und die Option 'noprint' unterdrückt die Anzeige der Standardausgabe von PROC MEANS.
Kopiert!
1 PROC MEANS DATA=pdata sum noprint;
2 var aux mm_1;
3 OUTPUT out=new sum=aux mm_1;
4 RUN;
6 Codeblock
DATA STEP
Erklärung :
Dieser DATA STEP liest das Dataset 'new' (das die Summen von 'aux' und 'mm_1' enthält) und berechnet die Z-Statistik des Score-Tests sowie den zugehörigen p-Wert ('pval'). Formate und Beschriftungen werden auf die Variablen angewendet, um eine bessere Darstellung zu ermöglichen.
Kopiert!
1 DATA new;
2 SET new;
3 label Z = "GOF Test";
4 label PVal = "P-Value";
5 FORMAT Z 8.2 Pval pvalue6.;
6 z = aux / sqrt( 2*mm_1 );
7 pval = 1 - probnorm( z );
8 RUN;
7 Codeblock
PROC PRINT
Erklärung :
Dieser Block generiert die Endausgabe. ODS HTML wird aktiviert, um die Ausgabe in eine HTML-Datei (oder die SAS Studio-Umgebung) umzuleiten. Ein Titel wird definiert. PROC PRINT wird verwendet, um die Variablen 'z' (Teststatistik) und 'pval' (p-Wert) aus dem Dataset 'new' anzuzeigen. Die Optionen 'noobs' unterdrücken die Beobachtungsnummer und 'label' verwendet die definierten Beschriftungen für die Spaltenüberschriften. ODS HTML wird anschließend geschlossen.
Kopiert!
1 ods html;
2 title "Score Test Statistic, Dean (1992)";
3 PROC PRINT DATA=new noobs label;
4 var z pval;
5 RUN;
6 ods html close;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Score Test Statistic, Dean (1992). Example from Efron (1978, 1986).