Estimación EM con PROC MI para datos con valores faltantes

Este código también está disponible en: Deutsch English Français Español
Nivel de dificultad
Principiante
Publicado el :
El script comienza creando un conjunto de datos llamado `Fitness1` que contiene medidas de condición física (Oxígeno, Tiempo de Carrera, Pulso). Algunas de estas medidas están voluntariamente faltantes para simular un esquema de datos incompleto. Luego, el procedimiento `PROC MI` se llama con la opción `nimpute=0` para no realizar la imputación, sino para usar el algoritmo EM para estimar la media, la desviación estándar y la matriz de correlación de las variables. Los resultados de esta estimación se almacenan en la tabla `outem`, que finalmente se muestra con `PROC PRINT`.
Análisis de datos

Type : CREATION_INTERNE


Los datos se crean directamente en el script a través de un paso DATA con una instrucción `datalines`. Por lo tanto, el conjunto de datos `Fitness1` es completamente autónomo.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque DATA STEP crea la tabla `Fitness1` leyendo los datos proporcionados a través de `datalines`. Define tres variables numéricas: `Oxygen`, `RunTime` y `RunPulse`. El doble arroba ` @@` al final de la instrucción `input` permite leer varias observaciones desde la misma línea de datos.
¡Copiado!
1DATA Fitness1;
2 INPUT Oxygen RunTime RunPulse @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
444.609 11.37 178 45.313 10.07 185
554.297 8.65 156 59.571 . .
649.874 9.22 . 44.811 11.63 176
7 . 11.95 176 . 10.85 .
839.442 13.08 174 60.055 8.63 170
950.541 . . 37.388 14.03 186
1044.754 11.12 176 47.273 . .
1151.855 10.33 166 49.156 8.95 180
1240.836 10.95 168 46.672 10.00 .
1346.774 10.25 . 50.388 10.08 168
1439.407 12.63 174 46.080 11.17 156
1545.441 9.63 164 . 8.92 .
1645.118 11.08 . 39.203 12.88 168
1745.790 10.47 186 50.545 9.93 148
1848.673 9.40 186 47.920 11.50 170
1947.467 10.50 170
20;
2 Bloque de código
PROC MI Data
Explicación :
El procedimiento estadístico `PROC MI` analiza los datos faltantes en `Fitness1`. La opción `nimpute=0` especifica no crear conjuntos de datos imputados. La instrucción `em` solicita el cálculo de las estimaciones basadas en el algoritmo Expectation-Maximization (EM), que se guardan en una nueva tabla llamada `outem`. La opción `seed` asegura la reproducibilidad y `simple` solicita estadísticas descriptivas básicas.
¡Copiado!
1PROC MI DATA=Fitness1 seed=1518971 SIMPLE nimpute=0;
2 em itprint outem=outem;
3 var Oxygen RunTime RunPulse;
4RUN;
3 Bloque de código
PROC PRINT
Explicación :
Este bloque muestra el contenido de la tabla `outem`, que contiene las estimaciones (medias, covarianzas) calculadas por el procedimiento `PROC MI`.
¡Copiado!
1 
2PROC PRINT
3DATA=outem;
4title 'EM Estimates';
5RUN;
6 
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : S A S S A M P L E L I B R A R Y


Documentación relacionada

Aucune documentation spécifique pour cette catégorie.