Veröffentlicht am :
Statistik CREATION_INTERNE

Beispiel für multiple Imputation mit PROC MI

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript beginnt mit der Erstellung eines Datensatzes 'Fitness1' aus internen Daten (Datalines), der Fitnessmessungen mit absichtlich fehlenden Werten simuliert. Anschließend wird die PROC MI-Prozedur zum ersten Mal verwendet, um die multiplen Imputationen mittels einer MCMC-Methode zu generieren und das Ergebnis in der Tabelle 'outex10' zu speichern. Eine zweite Ausführung von PROC MI wird auf dem imputierten Datensatz mit der Option nimpute=0 durchgeführt, was typischerweise zur Analyse der Imputationsergebnisse ohne Erzeugung neuer Imputationen geschieht.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden direkt im Skript über einen DATA-Schritt mit einer DATALINES-Anweisung erstellt. Der Datensatz 'Fitness1' enthält Fitnessmessungen (Oxygen, RunTime, RunPulse) für mehrere Personen.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP-Block erstellt die Tabelle 'Fitness1'. Die 'input'-Anweisung liest drei numerische Variablen (Oxygen, RunTime, RunPulse). Der Spezifikator ' @@' (double trailing at) hält den Zeiger auf der Eingabedatenzeile, was das Lesen mehrerer Beobachtungen aus einer einzigen Zeile ermöglicht. Die Daten werden direkt im Code über die 'datalines'-Anweisung bereitgestellt.
Kopiert!
1DATA Fitness1;
2 INPUT Oxygen RunTime RunPulse @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
444.609 11.37 178 45.313 10.07 185
554.297 8.65 156 59.571 . .
649.874 9.22 . 44.811 11.63 176
7 . 11.95 176 . 10.85 .
839.442 13.08 174 60.055 8.63 170
950.541 . . 37.388 14.03 186
1044.754 11.12 176 47.273 . .
1151.855 10.33 166 49.156 8.95 180
1240.836 10.95 168 46.672 10.00 .
1346.774 10.25 . 50.388 10.08 168
1439.407 12.63 174 46.080 11.17 156
1545.441 9.63 164 . 8.92 .
1645.118 11.08 . 39.203 12.88 168
1745.790 10.47 186 50.545 9.93 148
1848.673 9.40 186 47.920 11.50 170
1947.467 10.50 170
20;
21 
2 Codeblock
PROC MI
Erklärung :
Diese Prozedur für multiple Imputation (MI) verarbeitet den Datensatz 'Fitness1'. Sie verwendet eine MCMC-Methode (Markov Chain Monte Carlo) mit monotoner Imputation, um Werte für fehlende Daten in den angegebenen Variablen zu generieren. Die Option 'seed' gewährleistet die Reproduzierbarkeit der Imputation. Die Ergebnisse, einschließlich der mehrfach imputierten Datensätze, werden in der Ausgabetabelle 'outex10' gespeichert.
Kopiert!
1PROC MI DATA=Fitness1 seed=17655417 out=outex10;
2 mcmc impute=monotone;
3 var Oxygen RunTime RunPulse;
4RUN;
3 Codeblock
PROC MI
Erklärung :
Die PROC MI-Prozedur wird erneut aufgerufen, diesmal auf der Tabelle 'outex10', die die imputierten Daten enthält. Die Option 'nimpute=0' zeigt an, dass keine neuen Imputationen durchgeführt werden sollen. Dieser Aufruf wird typischerweise verwendet, um deskriptive Statistiken oder Analysen über den gesamten imputierten Datensatz zu erhalten, indem die Ergebnisse der verschiedenen Imputationen kombiniert werden.
Kopiert!
1 
2PROC MI
3DATA=outex10 seed=15541 nimpute=0;
4var Oxygen RunTime RunPulse;
5RUN;
6 
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y