Le script commence par créer un jeu de données interne 'toxoplasmosis' via une DATA STEP et des datalines, incluant des variables pour le nombre de succès (t), le nombre total d'essais (m) et une variable 'rain' (pluie) qui est copiée dans 'z'. Ensuite, la variable 'z' est standardisée à l'aide de PROC STDIZE. Une PROC GLIMMIX est utilisée pour ajuster un modèle linéaire généralisé mixte avec une liaison logit et une distribution binomiale, en modélisant 't/m' en fonction de 'z', 'z*z' et 'z*z*z'. Les prédictions du modèle sont exportées pour le calcul de la statistique de score. Une DATA STEP subséquente calcule des termes intermédiaires nécessaires pour le test. PROC MEANS agrège ces termes, et une dernière DATA STEP calcule la statistique Z du test de score et sa p-value associée. Enfin, PROC PRINT affiche les résultats dans une sortie HTML formatée.
Analyse des données
Type : CREATION_INTERNE
Les données sont créées directement dans le script via une DATA STEP et des 'datalines'.
1 Bloc de code
DATA STEP Data
Explication : Ce bloc DATA STEP crée le jeu de données 'toxoplasmosis' en lisant des données brutes (t, m, rain) directement à partir des 'datalines'. Une nouvelle variable 'z' est créée comme une copie de la variable 'rain'.
Explication : Cette procédure standardise la variable 'z' dans le jeu de données 'toxoplasmosis'. Le jeu de données de sortie écrase l'original, garantissant que les calculs ultérieurs utilisent la version standardisée de 'z'.
Copié !
proc stdize data=toxoplasmosis out=toxoplasmosis;
var z;
run;
1
2
PROC STDIZE
3
DATA=toxoplasmosis out=toxoplasmosis;
4
var z;
5
6
RUN;
7
3 Bloc de code
PROC GLIMMIX
Explication : PROC GLIMMIX est utilisée pour ajuster un modèle linéaire généralisé mixte. Le modèle spécifie une réponse binomiale (t/m), une fonction de lien logit, et inclut 'z', 'z*z' et 'z*z*z' comme prédicteurs. L'option 's' demande des statistiques sommaires. La clause 'output' crée un nouveau jeu de données 'pdata' contenant les probabilités prédites ('pi') sans les effets aléatoires (noblup) et sur l'échelle de la réponse (ilink).
Explication : Cette DATA STEP lit le jeu de données 'pdata' (créé par GLIMMIX) et calcule plusieurs variables intermédiaires ('pic', 'pipic', 'mpi', 't_mpi', 'pit_mpi', 'tpic', 'mm_1', 'aux') nécessaires pour la formule de la statistique de test de score de Dean. Seules 'aux' et 'mm_1' sont conservées pour les étapes ultérieures.
Copié !
data pdata;
set pdata;
pic = 1 - pi;
pipic = pi * pic;
mpi = m * pi;
t_mpi = t - mpi;
pit_mpi = pi * t_mpi;
tpic = t * pic;
mm_1 = m * (m-1);
aux = ( t_mpi*t_mpi + pit_mpi - tpic ) / pipic;
keep aux mm_1;
run;
1
DATA pdata;
2
SET pdata;
3
pic = 1 - pi;
4
pipic = pi * pic;
5
mpi = m * pi;
6
t_mpi = t - mpi;
7
pit_mpi = pi * t_mpi;
8
tpic = t * pic;
9
mm_1 = m * (m-1);
10
aux = ( t_mpi*t_mpi + pit_mpi - tpic ) / pipic;
11
keep aux mm_1;
12
RUN;
5 Bloc de code
PROC MEANS
Explication : PROC MEANS est utilisée ici pour calculer la somme des variables 'aux' et 'mm_1' sur l'ensemble du jeu de données 'pdata'. Le résultat est stocké dans un nouveau jeu de données appelé 'new', et l'option 'noprint' supprime l'affichage de la sortie par défaut de PROC MEANS.
Copié !
proc means data=pdata sum noprint;
var aux mm_1;
output out=new sum=aux mm_1;
run;
1
PROC MEANSDATA=pdata sum noprint;
2
var aux mm_1;
3
OUTPUT out=new sum=aux mm_1;
4
RUN;
6 Bloc de code
DATA STEP
Explication : Cette DATA STEP lit le jeu de données 'new' (contenant les sommes de 'aux' et 'mm_1') et calcule la statistique Z du test de score ainsi que sa p-value ('pval'). Les formats et les libellés sont appliqués aux variables pour une meilleure présentation.
Copié !
data new;
set new;
label Z = "GOF Test";
label PVal = "P-Value";
format Z 8.2 Pval pvalue6.;
z = aux / sqrt( 2*mm_1 );
pval = 1 - probnorm( z );
run;
1
DATA new;
2
SET new;
3
label Z = "GOF Test";
4
label PVal = "P-Value";
5
FORMAT Z 8.2 Pval pvalue6.;
6
z = aux / sqrt( 2*mm_1 );
7
pval = 1 - probnorm( z );
8
RUN;
7 Bloc de code
PROC PRINT
Explication : Ce bloc génère la sortie finale. ODS HTML est activé pour diriger la sortie vers un fichier HTML (ou l'environnement SAS Studio). Un titre est défini. PROC PRINT est utilisée pour afficher les variables 'z' (statistique du test) et 'pval' (p-value) du jeu de données 'new'. Les options 'noobs' suppriment le numéro d'observation et 'label' utilise les libellés définis pour les en-têtes de colonne. ODS HTML est ensuite fermé.
Copié !
ods html;
title "Score Test Statistic, Dean (1992)";
proc print data=new noobs label;
var z pval;
run;
ods html close;
1
ods html;
2
title "Score Test Statistic, Dean (1992)";
3
PROC PRINTDATA=new noobs label;
4
var z pval;
5
RUN;
6
ods html close;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Score Test Statistic, Dean (1992). Example from Efron (1978, 1986).
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.