L'utilisation de la PROC GENMOD pour une régression logistique offre une flexibilité supérieure à la procédure LOGISTIC classique, notamment pour traiter des données agrégées ou issues de plans d'expériences complexes. Dans ce script, l'objectif est de quantifier l'influence de deux facteurs catégoriels — la race et le traitement (AZT) — sur la survenue d'un événement binaire.Pourquoi cette méthodologie est-elle rigoureuse ?Syntaxe Événements/Essais : L'instruction MODEL yes/cases est la méthode de référence pour traiter des données groupées. Au lieu d'avoir une ligne par patient, vous travaillez sur des proportions. SAS calcule automatiquement la probabilité $p$ de l'événement yes sur le nombre total d'essais (cases), ce qui optimise considérablement le temps de calcul sur de grands effectifs.Distribution et Fonction de Lien : En spécifiant dist=bin et link=logit, vous définissez explicitement un modèle linéaire généralisé (GLM) de type logistique. Le logit transforme la probabilité en une échelle linéaire, permettant d'estimer des Odds Ratios pour chaque facteur.Tests de Type 3 et Statistiques : L'option TYPE3 est cruciale en expertise statistique : elle fournit des tests de Wald pour chaque effet global, indépendamment de l'ordre d'entrée dans le modèle. L'option OBSTATS permet quant à elle de vérifier l'adéquation du modèle en comparant les valeurs observées aux probabilités prédites.
Type : CREATION_INTERNE
Les données sont incluses directement dans le code via l'instruction CARDS (données sur l'AZT et la race).
| 1 | DATA aids; |
| 2 | INPUT race $ azt $ yes no @@; |
| 3 | cases = yes + no; |
| 4 | CARDS; |
| 5 | white y 14 93 white n 32 81 |
| 6 | black y 11 52 black n 12 43 |
| 7 | ; |
| 8 | RUN; |
| 1 | PROC GENMOD order=DATA; |
| 2 | CLASS race azt; |
| 3 | MODEL yes/cases = race azt /dist=bin link=logit obstats type3; |
| 4 | RUN; |