Le Conseil de l'Expert
Stéphanie
Spécialiste Machine Learning et IA.
« Parole d'expert : Corriger le biais d'échantillonnage avec PROC LOGISTIC
Dans les études cas-témoins, la surreprésentation artificielle des "malades" (souvent 50% de l'échantillon) booste la puissance statistique, mais fausse totalement les probabilités prédites. L'option PEVENT est ici votre outil de calibration indispensable : elle permet d'injecter la prévalence réelle du phénomène (ex: 1% de la population) directement dans le modèle. Sans cette correction, vos tableaux de classification (CTABLE) afficheraient des taux de faux positifs et des valeurs prédictives totalement déconnectés de la réalité du terrain. En spécifiant PEVENT=0.01, vous demandez à SAS de recalculer les seuils de décision (PPROB) pour qu'ils reflètent la rareté réelle de l'événement, transformant un simple modèle statistique en un outil de diagnostic fiable. »