percentile boxPlot

Análisis de Datos de Ensayo Clínico con Valores Faltantes

Scénario de test & Cas d'usage

Contexto empresarial

Una farmacéutica analiza los resultados de un ensayo clínico para un nuevo medicamento. Los datos de respuesta del paciente ('mejora_clinica') contienen valores faltantes. Además, una variable de agrupación demográfica ('region_geografica') también tiene datos ausentes. El análisis debe tratar los valores faltantes como una categoría de grupo separada para investigar si la falta de datos está correlacionada con algún patrón.
Sobre el conjunto : percentile

Cálculo preciso de percentiles y cuantiles.

Descubrir todas las acciones de percentile
Preparación de datos

Crea datos de un ensayo clínico. Se introducen valores faltantes (.) tanto en la variable de análisis ('mejora_clinica') como en la variable de agrupación ('region_geografica').

¡Copiado!
1DATA casuser.ensayo_clinico;
2 call streaminit(789);
3 LENGTH region_geografica $10;
4 DO i = 1 to 2000;
5 r = rand('UNIFORM');
6 IF r < 0.4 THEN region_geografica = 'Europa';
7 ELSE IF r < 0.75 THEN region_geografica = 'America';
8 ELSE IF r < 0.9 THEN region_geografica = 'Asia';
9 ELSE region_geografica = ''; /* Valor faltante */
10 
11 IF region_geografica = 'Europa' THEN mejora_clinica = 50 + rand('NORMAL', 0, 10);
12 ELSE IF region_geografica = 'America' THEN mejora_clinica = 45 + rand('NORMAL', 0, 12);
13 ELSE IF region_geografica = 'Asia' THEN mejora_clinica = 55 + rand('NORMAL', 0, 8);
14 ELSE mejora_clinica = 30 + rand('NORMAL', 0, 5);
15 
16 /* Introducir valores faltantes en la variable de análisis */
17 IF rand('UNIFORM') < 0.1 THEN mejora_clinica = .;
18 
19 OUTPUT;
20 END;
21RUN;

Étapes de réalisation

1
Ejecución de boxPlot agrupando por 'region_geografica' y utilizando 'includeMissingGroup=TRUE' para tratar los valores faltantes como un grupo. Se usa el método 'EXACT' (pctlDef=5) para mayor precisión.
¡Copiado!
1PROC CAS;
2 percentile.boxPlot
3 TABLE={name='ensayo_clinico', groupBy={'region_geografica'}},
4 inputs={{name='mejora_clinica'}},
5 includeMissingGroup=true,
6 pctlDef=5, /* Equivalente a método exacto */
7 casOut={name='analisis_clinico_faltantes', replace=true};
8RUN;
9QUIT;

Resultado esperado


La tabla de salida 'analisis_clinico_faltantes' debe contener cuatro grupos de resultados para la variable 'mejora_clinica': uno para 'Europa', uno para 'America', uno para 'Asia' y un cuarto grupo para los registros donde 'region_geografica' es un valor faltante. La acción debe ignorar los valores faltantes en 'mejora_clinica' para los cálculos estadísticos dentro de cada grupo, pero el grupo de 'region_geografica' faltante debe ser procesado correctamente, permitiendo a los investigadores evaluar si el perfil de los pacientes con datos demográficos incompletos es diferente.