Lorsqu'il s'agit d'analyser des tableaux de fréquences croisées, la PROC GENMOD offre une alternative puissante aux tests de Chi-deux classiques en utilisant un modèle log-linéaire. Ce script modélise le nombre d'individus (count) en fonction du genre et des croyances, permettant ainsi de tester statistiquement l'indépendance ou l'association entre ces facteurs.
Pourquoi cette méthodologie est-elle rigoureuse ?
Distribution de Poisson et Lien Log : Le choix dist=poisson est la norme pour des données de comptage d'événements indépendants. La fonction de lien link=log garantit que les prédictions du modèle (les effectifs attendus) restent toujours positives, ce qui est une nécessité mathématique pour des fréquences.
Analyse de l'Interaction (gen*belief) : C'est le point crucial de l'expertise. Dans un modèle log-linéaire, l'interaction représente la dépendance entre les variables. Si le terme d'interaction est statistiquement significatif, cela prouve que la croyance n'est pas répartie de la même manière selon le genre, invalidant l'hypothèse d'indépendance.
Diagnostics via OBSTATS : L'option obstats (Observation Statistics) permet de comparer les valeurs observées aux valeurs prédites par le modèle. Elle aide à identifier d'éventuels résidus importants qui signaleraient une mauvaise adéquation du modèle aux données.
Type : CREATION_INTERNE
Les données sont générées directement dans le code via l'instruction CARDS (datalines).
| 1 | DATA belief; |
| 2 | INPUT gen $ belief $ count; |
| 3 | CARDS; |
| 4 | F Y 435 |
| 5 | F N 147 |
| 6 | M Y 375 |
| 7 | M N 134 |
| 8 | ; |
| 1 | PROC GENMOD DATA = belief ORDER = DATA; |
| 2 | CLASS gen belief; |
| 3 | MODEL count = gen belief gen*belief/dist=poisson link=log obstats; |
| 4 | RUN; |