L'utilisation de la PROC GENMOD pour traiter des données de type "événements/essais" est la méthode de référence en épidémiologie pour quantifier l'impact d'une exposition (ici, le tabagisme) sur une issue de santé. Ce script transforme des comptages bruts en un modèle prédictif de probabilité, permettant de dépasser la simple observation pour atteindre une analyse de corrélation statistique rigoureuse.Pourquoi cette méthodologie est-elle robuste ?Gestion des données agrégées : La syntaxe yes/cases est particulièrement efficace. Elle permet au moteur SAS de traiter des groupes d'individus ayant le même niveau d'exposition en une seule unité statistique, calculant ainsi directement la probabilité $p$ de l'événement au sein de chaque strate.Fonction de lien Logit : En spécifiant link=logit, vous modélisez le logarithme de l'odd (le ratio des chances). C'est ce qui permet de transformer une probabilité bornée entre 0 et 1 en une variable continue, facilitant l'estimation de l'Odds Ratio associé à chaque unité de cigarette supplémentaire.Fiabilité des Tests de Type 3 : L'option TYPE3 génère des tests de Wald pour évaluer la significativité globale du facteur 'smoking'. C'est un indicateur plus fiable que les simples tests de paramètres, car il mesure l'apport de la variable au modèle indépendamment de sa position dans l'équation.
Type : CREATION_INTERNE
Les données sont incluses directement dans le script via l'instruction CARDS.
| 1 | DATA smoking; |
| 2 | INPUT smoking yes no @@; |
| 3 | cases = yes + no; |
| 4 | CARDS; |
| 5 | 0 90 346 7.5 57 91 |
| 6 | 19.5 65 48 30 40 18 |
| 7 | ; |
| 8 | RUN; |
| 1 | |
| 2 | PROC GENMOD order= |
| 3 | DATA; |
| 4 | |
| 5 | MODEL yes/cases = smoking /dist=bin link=logit obstats type3; |
| 6 | |
| 7 | RUN; |
| 8 |