Das Skript beginnt mit der Erstellung eines internen Datasets 'toxoplasmosis' über einen DATA STEP und Datalines, einschließlich Variablen für die Anzahl der Erfolge (t), die Gesamtzahl der Versuche (m) und eine Variable 'rain' (Regen), die in 'z' kopiert wird. Anschließend wird die Variable 'z' mit PROC STDIZE standardisiert. Eine PROC GLIMMIX wird verwendet, um ein verallgemeinertes lineares gemischtes Modell mit einem Logit-Link und einer Binomialverteilung anzupassen, wobei 't/m' als Funktion von 'z', 'z*z' und 'z*z*z' modelliert wird. Die Modellvorhersagen werden für die Berechnung der Score-Statistik exportiert. Ein nachfolgender DATA STEP berechnet die für den Test erforderlichen Zwischenterme. PROC MEANS aggregiert diese Terme, und ein letzter DATA STEP berechnet die Z-Statistik des Score-Tests und den zugehörigen p-Wert. Schließlich zeigt PROC PRINT die Ergebnisse in einer formatierten HTML-Ausgabe an.
Datenanalyse
Type : CREATION_INTERNE
Die Daten werden direkt im Skript über einen DATA STEP und 'datalines' erstellt.
1 Codeblock
DATA STEP Data
Erklärung : Dieser DATA STEP-Block erstellt das Dataset 'toxoplasmosis', indem Rohdaten (t, m, rain) direkt aus den 'datalines' gelesen werden. Eine neue Variable 'z' wird als Kopie der Variablen 'rain' erstellt.
Erklärung : Diese Prozedur standardisiert die Variable 'z' im Dataset 'toxoplasmosis'. Das Ausgabedataset überschreibt das Original, um sicherzustellen, dass nachfolgende Berechnungen die standardisierte Version von 'z' verwenden.
Kopiert!
proc stdize data=toxoplasmosis out=toxoplasmosis;
var z;
run;
1
2
PROC STDIZE
3
DATA=toxoplasmosis out=toxoplasmosis;
4
var z;
5
6
RUN;
7
3 Codeblock
PROC GLIMMIX
Erklärung : PROC GLIMMIX wird verwendet, um ein verallgemeinertes lineares gemischtes Modell anzupassen. Das Modell spezifiziert eine binomiale Antwort (t/m), eine Logit-Link-Funktion und enthält 'z', 'z*z' und 'z*z*z' als Prädiktoren. Die Option 's' fordert Zusammenfassungsstatistiken an. Die 'output'-Klausel erstellt ein neues Dataset 'pdata', das die vorhergesagten Wahrscheinlichkeiten ('pi') ohne Zufallseffekte (noblup) und auf der Antwortskala (ilink) enthält.
Erklärung : Dieser DATA STEP liest das Dataset 'pdata' (erstellt von GLIMMIX) und berechnet mehrere Zwischenvariablen ('pic', 'pipic', 'mpi', 't_mpi', 'pit_mpi', 'tpic', 'mm_1', 'aux'), die für die Formel der Dean'schen Score-Test-Statistik erforderlich sind. Nur 'aux' und 'mm_1' werden für spätere Schritte beibehalten.
Kopiert!
data pdata;
set pdata;
pic = 1 - pi;
pipic = pi * pic;
mpi = m * pi;
t_mpi = t - mpi;
pit_mpi = pi * t_mpi;
tpic = t * pic;
mm_1 = m * (m-1);
aux = ( t_mpi*t_mpi + pit_mpi - tpic ) / pipic;
keep aux mm_1;
run;
1
DATA pdata;
2
SET pdata;
3
pic = 1 - pi;
4
pipic = pi * pic;
5
mpi = m * pi;
6
t_mpi = t - mpi;
7
pit_mpi = pi * t_mpi;
8
tpic = t * pic;
9
mm_1 = m * (m-1);
10
aux = ( t_mpi*t_mpi + pit_mpi - tpic ) / pipic;
11
keep aux mm_1;
12
RUN;
5 Codeblock
PROC MEANS
Erklärung : PROC MEANS wird hier verwendet, um die Summe der Variablen 'aux' und 'mm_1' über das gesamte Dataset 'pdata' zu berechnen. Das Ergebnis wird in einem neuen Dataset namens 'new' gespeichert, und die Option 'noprint' unterdrückt die Anzeige der Standardausgabe von PROC MEANS.
Kopiert!
proc means data=pdata sum noprint;
var aux mm_1;
output out=new sum=aux mm_1;
run;
1
PROC MEANSDATA=pdata sum noprint;
2
var aux mm_1;
3
OUTPUT out=new sum=aux mm_1;
4
RUN;
6 Codeblock
DATA STEP
Erklärung : Dieser DATA STEP liest das Dataset 'new' (das die Summen von 'aux' und 'mm_1' enthält) und berechnet die Z-Statistik des Score-Tests sowie den zugehörigen p-Wert ('pval'). Formate und Beschriftungen werden auf die Variablen angewendet, um eine bessere Darstellung zu ermöglichen.
Kopiert!
data new;
set new;
label Z = "GOF Test";
label PVal = "P-Value";
format Z 8.2 Pval pvalue6.;
z = aux / sqrt( 2*mm_1 );
pval = 1 - probnorm( z );
run;
1
DATA new;
2
SET new;
3
label Z = "GOF Test";
4
label PVal = "P-Value";
5
FORMAT Z 8.2 Pval pvalue6.;
6
z = aux / sqrt( 2*mm_1 );
7
pval = 1 - probnorm( z );
8
RUN;
7 Codeblock
PROC PRINT
Erklärung : Dieser Block generiert die Endausgabe. ODS HTML wird aktiviert, um die Ausgabe in eine HTML-Datei (oder die SAS Studio-Umgebung) umzuleiten. Ein Titel wird definiert. PROC PRINT wird verwendet, um die Variablen 'z' (Teststatistik) und 'pval' (p-Wert) aus dem Dataset 'new' anzuzeigen. Die Optionen 'noobs' unterdrücken die Beobachtungsnummer und 'label' verwendet die definierten Beschriftungen für die Spaltenüberschriften. ODS HTML wird anschließend geschlossen.
Kopiert!
ods html;
title "Score Test Statistic, Dean (1992)";
proc print data=new noobs label;
var z pval;
run;
ods html close;
1
ods html;
2
title "Score Test Statistic, Dean (1992)";
3
PROC PRINTDATA=new noobs label;
4
var z pval;
5
RUN;
6
ods html close;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Score Test Statistic, Dean (1992). Example from Efron (1978, 1986).
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.