Publié le :
Statistique CREATION_INTERNE

Statistique de Test de Score de Dean (1992)

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script commence par créer un jeu de données interne 'toxoplasmosis' via une DATA STEP et des datalines, incluant des variables pour le nombre de succès (t), le nombre total d'essais (m) et une variable 'rain' (pluie) qui est copiée dans 'z'. Ensuite, la variable 'z' est standardisée à l'aide de PROC STDIZE. Une PROC GLIMMIX est utilisée pour ajuster un modèle linéaire généralisé mixte avec une liaison logit et une distribution binomiale, en modélisant 't/m' en fonction de 'z', 'z*z' et 'z*z*z'. Les prédictions du modèle sont exportées pour le calcul de la statistique de score. Une DATA STEP subséquente calcule des termes intermédiaires nécessaires pour le test. PROC MEANS agrège ces termes, et une dernière DATA STEP calcule la statistique Z du test de score et sa p-value associée. Enfin, PROC PRINT affiche les résultats dans une sortie HTML formatée.
Analyse des données

Type : CREATION_INTERNE


Les données sont créées directement dans le script via une DATA STEP et des 'datalines'.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA STEP crée le jeu de données 'toxoplasmosis' en lisant des données brutes (t, m, rain) directement à partir des 'datalines'. Une nouvelle variable 'z' est créée comme une copie de la variable 'rain'.
Copié !
1 DATA toxoplasmosis;
2 INPUT t m rain;
3 z = rain;
4 DATALINES;
5 2 4 1735
6 3 10 1936
7 1 5 2000
8 3 10 1973
9 2 2 1750
10 3 5 1800
11 2 8 1750
12 7 19 2077
13 3 6 1920
14 8 10 1800
15 7 24 2050
16 0 1 1830
17 15 30 1650
18 4 22 2200
19 0 1 2000
20 6 11 1770
21 0 1 1920
22 33 54 1770
23 4 9 2240
24 5 18 1620
25 2 12 1756
26 0 1 1650
27 8 11 2250
28 41 77 1796
29 24 51 1890
30 7 16 1871
31 46 82 2063
32 9 13 2100
33 23 43 1918
34 53 75 1834
35 8 13 1780
36 3 10 1900
37 1 6 1976
38 23 37 2292
39 ;
2 Bloc de code
PROC STDIZE
Explication :
Cette procédure standardise la variable 'z' dans le jeu de données 'toxoplasmosis'. Le jeu de données de sortie écrase l'original, garantissant que les calculs ultérieurs utilisent la version standardisée de 'z'.
Copié !
1 
2PROC STDIZE
3DATA=toxoplasmosis out=toxoplasmosis;
4var z;
5 
6RUN;
7 
3 Bloc de code
PROC GLIMMIX
Explication :
PROC GLIMMIX est utilisée pour ajuster un modèle linéaire généralisé mixte. Le modèle spécifie une réponse binomiale (t/m), une fonction de lien logit, et inclut 'z', 'z*z' et 'z*z*z' comme prédicteurs. L'option 's' demande des statistiques sommaires. La clause 'output' crée un nouveau jeu de données 'pdata' contenant les probabilités prédites ('pi') sans les effets aléatoires (noblup) et sur l'échelle de la réponse (ilink).
Copié !
1 ods select none;
2 PROC GLIMMIX DATA=toxoplasmosis;
3 model t/m = z z*z z*z*z / link=logit dist=bin s;
4 OUTPUT out=pdata pred(noblup ilink) = pi;
5 RUN;
6 ods select all;
4 Bloc de code
DATA STEP
Explication :
Cette DATA STEP lit le jeu de données 'pdata' (créé par GLIMMIX) et calcule plusieurs variables intermédiaires ('pic', 'pipic', 'mpi', 't_mpi', 'pit_mpi', 'tpic', 'mm_1', 'aux') nécessaires pour la formule de la statistique de test de score de Dean. Seules 'aux' et 'mm_1' sont conservées pour les étapes ultérieures.
Copié !
1 DATA pdata;
2 SET pdata;
3 pic = 1 - pi;
4 pipic = pi * pic;
5 mpi = m * pi;
6 t_mpi = t - mpi;
7 pit_mpi = pi * t_mpi;
8 tpic = t * pic;
9 mm_1 = m * (m-1);
10 aux = ( t_mpi*t_mpi + pit_mpi - tpic ) / pipic;
11 keep aux mm_1;
12 RUN;
5 Bloc de code
PROC MEANS
Explication :
PROC MEANS est utilisée ici pour calculer la somme des variables 'aux' et 'mm_1' sur l'ensemble du jeu de données 'pdata'. Le résultat est stocké dans un nouveau jeu de données appelé 'new', et l'option 'noprint' supprime l'affichage de la sortie par défaut de PROC MEANS.
Copié !
1 PROC MEANS DATA=pdata sum noprint;
2 var aux mm_1;
3 OUTPUT out=new sum=aux mm_1;
4 RUN;
6 Bloc de code
DATA STEP
Explication :
Cette DATA STEP lit le jeu de données 'new' (contenant les sommes de 'aux' et 'mm_1') et calcule la statistique Z du test de score ainsi que sa p-value ('pval'). Les formats et les libellés sont appliqués aux variables pour une meilleure présentation.
Copié !
1 DATA new;
2 SET new;
3 label Z = "GOF Test";
4 label PVal = "P-Value";
5 FORMAT Z 8.2 Pval pvalue6.;
6 z = aux / sqrt( 2*mm_1 );
7 pval = 1 - probnorm( z );
8 RUN;
7 Bloc de code
PROC PRINT
Explication :
Ce bloc génère la sortie finale. ODS HTML est activé pour diriger la sortie vers un fichier HTML (ou l'environnement SAS Studio). Un titre est défini. PROC PRINT est utilisée pour afficher les variables 'z' (statistique du test) et 'pval' (p-value) du jeu de données 'new'. Les options 'noobs' suppriment le numéro d'observation et 'label' utilise les libellés définis pour les en-têtes de colonne. ODS HTML est ensuite fermé.
Copié !
1 ods html;
2 title "Score Test Statistic, Dean (1992)";
3 PROC PRINT DATA=new noobs label;
4 var z pval;
5 RUN;
6 ods html close;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Score Test Statistic, Dean (1992). Example from Efron (1978, 1986).