Veröffentlicht am :
Statistik CREATION_INTERNE

Beispiel für multiple Imputation mit PROC MI

Dieser Code ist auch verfügbar auf: English Français
Wartet auf Validierung
Das Skript erstellt zunächst einen Datensatz namens 'Fitness1', der Messungen der körperlichen Fitness (Sauerstoffverbrauch, Laufzeit, Ruhepuls) mit willkürlich eingeführten fehlenden Werten enthält. Anschließend wird die Prozedur `PROC MI` mit einer MCMC-Methode (Markov Chain Monte Carlo) verwendet, um multiple Imputationen für diese fehlenden Daten zu generieren. Das Ergebnis wird in einem neuen Datensatz 'outmi' gespeichert. Schließlich werden die ersten 10 Beobachtungen des imputierten Datensatzes zur Überprüfung angezeigt.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden direkt im Skript über einen DATA-Schritt mit der Anweisung `datalines` erstellt. Der Datensatz 'Fitness1' enthält Messungen der körperlichen Fitness.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser Codeblock erstellt die Tabelle 'Fitness1'. Er liest Daten, die direkt in das Programm integriert sind, mithilfe der Anweisung 'datalines'. Der Formatierungsbezeichner ' @@' wird in der INPUT-Anweisung verwendet, um SAS anzuzeigen, dass sich mehrere Beobachtungen in derselben Datenzeile befinden können.
Kopiert!
1DATA Fitness1;
2 INPUT Oxygen RunTime RunPulse @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
444.609 11.37 178 45.313 10.07 185
554.297 8.65 156 59.571 . .
649.874 9.22 . 44.811 11.63 176
7 . 11.95 176 . 10.85 .
839.442 13.08 174 60.055 8.63 170
950.541 . . 37.388 14.03 186
1044.754 11.12 176 47.273 . .
1151.855 10.33 166 49.156 8.95 180
1240.836 10.95 168 46.672 10.00 .
1346.774 10.25 . 50.388 10.08 168
1439.407 12.63 174 46.080 11.17 156
1545.441 9.63 164 . 8.92 .
1645.118 11.08 . 39.203 12.88 168
1745.790 10.47 186 50.545 9.93 148
1848.673 9.40 186 47.920 11.50 170
1947.467 10.50 170
20;
21 
2 Codeblock
PROC MI Data
Erklärung :
Diese Prozedur führt eine multiple Imputation auf dem Datensatz 'Fitness1' durch. Die Option 'seed' initialisiert den Zufallszahlengenerator für die Reproduzierbarkeit. Die Option 'mu0' gibt die Anfangsmittelwerte für den Imputationsalgorithmus an. Die Anweisung 'mcmc' ruft die Markov Chain Monte Carlo-Methode auf. Die Variablen 'Oxygen', 'RunTime' und 'RunPulse' werden für die Imputation angegeben. Das Ergebnis wird in der Tabelle 'outmi' gespeichert.
Kopiert!
1PROC MI DATA=Fitness1 seed=501213 mu0=50 10 180 out=outmi;
2 mcmc;
3 var Oxygen RunTime RunPulse;
4RUN;
3 Codeblock
PROC PRINT
Erklärung :
Dieser Block zeigt die ersten 10 Zeilen (Option obs=10) des Datensatzes 'outmi', der die durch PROC MI imputierten Werte enthält. Ein Titel wird hinzugefügt, um die Ausgabe zu verdeutlichen.
Kopiert!
1 
2PROC PRINT
3DATA=outmi (obs=10);
4title 'First 10 Observations of the Imputed
5Data Set';
6RUN;
7 
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y