Veröffentlicht am :
Statistik INTERNE_ERSTELLUNG

Beispiel für Multiple Imputation mit PROC MI

Dieser Code ist auch verfügbar auf: Español Français
Wartet auf Validierung
Der Code beginnt mit der Erstellung eines Datensatzes 'Fitness1', der Fitnessmessungen (Oxygen, RunTime, RunPulse) enthält. Einige Werte fehlen, um ein beliebiges Muster fehlender Daten zu veranschaulichen. Anschließend wird die Prozedur `PROC MI` verwendet, um diese fehlenden Werte zu imputieren. Sie generiert 5 imputierte Datensätze unter Verwendung einer MCMC-Methode (Markov Chain Monte Carlo) und erstellt Diagnosegrafiken zur Bewertung der Konvergenz der Ketten.
Datenanalyse

Type : INTERNE_ERSTELLUNG


Die Daten werden direkt im Skript über einen DATA-Schritt mit einer DATALINES-Anweisung erstellt. Es gibt keine Abhängigkeit von externen Dateien.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser Codeblock erstellt die SAS-Tabelle 'Fitness1'. Die `input`-Anweisung liest die drei Variablen Oxygen, RunTime und RunPulse. Das doppelte 'at' (` @@`) am Ende der `input`-Anweisung weist SAS an, die aktuelle Datenzeile beizubehalten, um mehrere Beobachtungen aus derselben Zeile zu lesen.
Kopiert!
1DATA Fitness1;
2 INPUT Oxygen RunTime RunPulse @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
444.609 11.37 178 45.313 10.07 185
554.297 8.65 156 59.571 . .
649.874 9.22 . 44.811 11.63 176
7 . 11.95 176 . 10.85 .
839.442 13.08 174 60.055 8.63 170
950.541 . . 37.388 14.03 186
1044.754 11.12 176 47.273 . .
1151.855 10.33 166 49.156 8.95 180
1240.836 10.95 168 46.672 10.00 .
1346.774 10.25 . 50.388 10.08 168
1439.407 12.63 174 46.080 11.17 156
1545.441 9.63 164 . 8.92 .
1645.118 11.08 . 39.203 12.88 168
1745.790 10.47 186 50.545 9.93 148
1848.673 9.40 186 47.920 11.50 170
1947.467 10.50 170
20;
21 
2 Codeblock
PROC MI
Erklärung :
Dieser Block verwendet die Prozedur zur multiplen Imputation `PROC MI`. Die Option `nimpute=5` fordert die Erstellung von 5 imputierten Datensätzen an. Die verwendete Imputationsmethode ist MCMC, wie durch die `mcmc`-Anweisung angegeben. Diagnosegrafiken (Trace und Autokorrelationsfunktion) werden für den Mittelwert der Variablen `Oxygen` angefordert, um die Konvergenz des Algorithmus zu überprüfen. Die zu imputierenden Variablen sind in der `var`-Anweisung aufgeführt.
Kopiert!
1ods graphics on;
2PROC MI DATA=Fitness1 seed=501213 nimpute=5 mu0=50 10 180;
3 mcmc plots=(trace(mean(Oxygen)) acf(mean(Oxygen)));
4 var Oxygen RunTime RunPulse;
5RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y, NAME: MIEX11, TITLE: Documentation Example 11 for PROC MI, PRODUCT: STAT