Publicado el :
Estadística CREATION_INTERNE

Ejemplo de Imputación Múltiple con PROC MI

Este código también está disponible en: Deutsch English Français
En espera de validación
El script comienza creando un conjunto de datos 'Fitness1' a partir de datos internos (datalines), que simula mediciones de condición física con valores faltantes intencionales. Luego, el procedimiento MI se utiliza por primera vez para generar las imputaciones múltiples mediante un método MCMC y almacena el resultado en la tabla 'outex10'. Se realiza una segunda ejecución de PROC MI en el conjunto de datos imputado con la opción nimpute=0, lo que se hace típicamente para analizar los resultados de la imputación sin generar nuevas.
Análisis de datos

Type : CREATION_INTERNE


Los datos se crean directamente en el script a través de un paso DATA con una instrucción DATALINES. El conjunto de datos 'Fitness1' contiene mediciones de condición física (Oxygen, RunTime, RunPulse) para varios individuos.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque DATA STEP crea la tabla 'Fitness1'. La instrucción 'input' lee tres variables numéricas (Oxygen, RunTime, RunPulse). El especificador ' @@' (double trailing at) mantiene el puntero en la línea de datos de entrada, permitiendo leer múltiples observaciones de una sola línea. Los datos se proporcionan directamente en el código a través de la instrucción 'datalines'.
¡Copiado!
1DATA Fitness1;
2 INPUT Oxygen RunTime RunPulse @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
444.609 11.37 178 45.313 10.07 185
554.297 8.65 156 59.571 . .
649.874 9.22 . 44.811 11.63 176
7 . 11.95 176 . 10.85 .
839.442 13.08 174 60.055 8.63 170
950.541 . . 37.388 14.03 186
1044.754 11.12 176 47.273 . .
1151.855 10.33 166 49.156 8.95 180
1240.836 10.95 168 46.672 10.00 .
1346.774 10.25 . 50.388 10.08 168
1439.407 12.63 174 46.080 11.17 156
1545.441 9.63 164 . 8.92 .
1645.118 11.08 . 39.203 12.88 168
1745.790 10.47 186 50.545 9.93 148
1848.673 9.40 186 47.920 11.50 170
1947.467 10.50 170
20;
21 
2 Bloque de código
PROC MI
Explicación :
Este procedimiento de imputación múltiple (MI) procesa el conjunto de datos 'Fitness1'. Utiliza un método MCMC (Markov Chain Monte Carlo) con imputación monótona para generar valores para los datos faltantes en las variables especificadas. La opción 'seed' garantiza la reproducibilidad de la imputación. Los resultados, incluyendo los múltiples conjuntos de datos imputados, se almacenan en la tabla de salida 'outex10'.
¡Copiado!
1PROC MI DATA=Fitness1 seed=17655417 out=outex10;
2 mcmc impute=monotone;
3 var Oxygen RunTime RunPulse;
4RUN;
3 Bloque de código
PROC MI
Explicación :
El procedimiento MI se llama nuevamente, esta vez sobre la tabla 'outex10' que contiene los datos imputados. La opción 'nimpute=0' indica que no se debe realizar ninguna imputación nueva. Este tipo de llamada se usa generalmente para obtener estadísticas descriptivas o análisis sobre el conjunto de datos imputados, combinando los resultados de las diferentes imputaciones.
¡Copiado!
1 
2PROC MI
3DATA=outex10 seed=15541 nimpute=0;
4var Oxygen RunTime RunPulse;
5RUN;
6 
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : S A S S A M P L E L I B R A R Y