EM-Schätzung mit PROC MI für Daten mit fehlenden Werten

Dieser Code ist auch verfügbar auf: English Español Français Deutsch
Schwierigkeitsgrad
Anfänger
Veröffentlicht am :
Das Skript beginnt mit der Erstellung eines Datensatzes namens `Fitness1`, der Fitnessmessungen (Sauerstoff, Laufzeit, Puls) enthält. Einige dieser Messungen fehlen absichtlich, um ein unvollständiges Datenschema zu simulieren. Anschließend wird die Prozedur `PROC MI` mit der Option `nimpute=0` aufgerufen, um keine Imputation durchzuführen, sondern den EM-Algorithmus zu verwenden, um den Mittelwert, die Standardabweichung und die Korrelationsmatrix der Variablen zu schätzen. Die Ergebnisse dieser Schätzung werden in der Tabelle `outem` gespeichert, die schließlich mit `PROC PRINT` angezeigt wird.
Datenanalyse

Type : INTERNE_ERSTELLUNG


Die Daten werden direkt im Skript über einen DATA-Schritt mit einer `datalines`-Anweisung erstellt. Der Datensatz `Fitness1` ist somit vollständig eigenständig.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP-Block erstellt die Tabelle `Fitness1` durch Lesen der über `datalines` bereitgestellten Daten. Er definiert drei numerische Variablen: `Oxygen`, `RunTime` und `RunPulse`. Das doppelte At-Zeichen ` @@` am Ende der `input`-Anweisung ermöglicht das Lesen mehrerer Beobachtungen aus derselben Datenzeile.
Kopiert!
1DATA Fitness1;
2 INPUT Oxygen RunTime RunPulse @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
444.609 11.37 178 45.313 10.07 185
554.297 8.65 156 59.571 . .
649.874 9.22 . 44.811 11.63 176
7 . 11.95 176 . 10.85 .
839.442 13.08 174 60.055 8.63 170
950.541 . . 37.388 14.03 186
1044.754 11.12 176 47.273 . .
1151.855 10.33 166 49.156 8.95 180
1240.836 10.95 168 46.672 10.00 .
1346.774 10.25 . 50.388 10.08 168
1439.407 12.63 174 46.080 11.17 156
1545.441 9.63 164 . 8.92 .
1645.118 11.08 . 39.203 12.88 168
1745.790 10.47 186 50.545 9.93 148
1848.673 9.40 186 47.920 11.50 170
1947.467 10.50 170
20;
2 Codeblock
PROC MI Data
Erklärung :
Die statistische Prozedur `PROC MI` analysiert fehlende Daten in `Fitness1`. Die Option `nimpute=0` gibt an, keine imputierten Datensätze zu erstellen. Die `em`-Anweisung fordert die Berechnung von Schätzungen basierend auf dem Erwartung-Maximierung (EM)-Algorithmus an, die in einer neuen Tabelle namens `outem` gespeichert werden. Die Option `seed` gewährleistet die Reproduzierbarkeit und `simple` fordert grundlegende deskriptive Statistiken an.
Kopiert!
1PROC MI DATA=Fitness1 seed=1518971 SIMPLE nimpute=0;
2 em itprint outem=outem;
3 var Oxygen RunTime RunPulse;
4RUN;
3 Codeblock
PROC PRINT
Erklärung :
Dieser Block zeigt den Inhalt der Tabelle `outem` an, die die von der Prozedur `PROC MI` berechneten Schätzungen (Mittelwerte, Kovarianzen) enthält.
Kopiert!
1 
2PROC PRINT
3DATA=outem;
4title 'EM Estimates';
5RUN;
6 
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y


Zugehörige Dokumentation

Aucune documentation spécifique pour cette catégorie.