Publié le :
Statistique CREATION_INTERNE

Exemple d'Imputation Multiple avec PROC MI

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script commence par créer un jeu de données 'Fitness1' à partir de données internes (datalines), qui simule des mesures de condition physique avec des valeurs manquantes intentionnelles. Ensuite, la procédure MI est utilisée une première fois pour générer les imputations multiples via une méthode MCMC et stocke le résultat dans la table 'outex10'. Une seconde exécution de PROC MI est effectuée sur le jeu de données imputé avec l'option nimpute=0, ce qui est typiquement fait pour analyser les résultats de l'imputation sans en générer de nouvelles.
Analyse des données

Type : CREATION_INTERNE


Les données sont créées directement dans le script via une étape DATA avec une instruction DATALINES. Le jeu de données 'Fitness1' contient des mesures de condition physique (Oxygen, RunTime, RunPulse) pour plusieurs individus.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA STEP crée la table 'Fitness1'. L'instruction 'input' lit trois variables numériques (Oxygen, RunTime, RunPulse). Le spécificateur '@@' (double trailing at) maintient le pointeur sur la ligne de données en entrée, permettant de lire plusieurs observations à partir d'une seule ligne. Les données sont fournies directement dans le code via l'instruction 'datalines'.
Copié !
1DATA Fitness1;
2 INPUT Oxygen RunTime RunPulse @@;
3 DATALINES;
444.609 11.37 178 45.313 10.07 185
554.297 8.65 156 59.571 . .
649.874 9.22 . 44.811 11.63 176
7 . 11.95 176 . 10.85 .
839.442 13.08 174 60.055 8.63 170
950.541 . . 37.388 14.03 186
1044.754 11.12 176 47.273 . .
1151.855 10.33 166 49.156 8.95 180
1240.836 10.95 168 46.672 10.00 .
1346.774 10.25 . 50.388 10.08 168
1439.407 12.63 174 46.080 11.17 156
1545.441 9.63 164 . 8.92 .
1645.118 11.08 . 39.203 12.88 168
1745.790 10.47 186 50.545 9.93 148
1848.673 9.40 186 47.920 11.50 170
1947.467 10.50 170
20;
21 
2 Bloc de code
PROC MI
Explication :
Cette procédure d'imputation multiple (MI) traite le jeu de données 'Fitness1'. Elle utilise une méthode MCMC (Markov Chain Monte Carlo) avec une imputation monotone pour générer des valeurs pour les données manquantes dans les variables spécifiées. L'option 'seed' garantit la reproductibilité de l'imputation. Les résultats, incluant les multiples jeux de données imputés, sont stockés dans la table de sortie 'outex10'.
Copié !
1PROC MI DATA=Fitness1 seed=17655417 out=outex10;
2 mcmc impute=monotone;
3 var Oxygen RunTime RunPulse;
4RUN;
3 Bloc de code
PROC MI
Explication :
La procédure MI est de nouveau appelée, cette fois sur la table 'outex10' qui contient les données imputées. L'option 'nimpute=0' indique qu'aucune nouvelle imputation ne doit être effectuée. Ce type d'appel est généralement utilisé pour obtenir des statistiques descriptives ou des analyses sur l'ensemble des données imputées, en combinant les résultats des différentes imputations.
Copié !
1 
2PROC MI
3DATA=outex10 seed=15541 nimpute=0;
4var Oxygen RunTime RunPulse;
5RUN;
6 
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : S A S S A M P L E L I B R A R Y