Publicado el :
Estadística CREATION_INTERNE

Análisis de sobredispersión en teratología

Este código también está disponible en: Deutsch English Français
En espera de validación
El análisis comienza con la creación de un conjunto de datos interno 'teratology'. Se leen las variables 'litter', 'group', 'n' (número total de observaciones) e 'y' (número de éxitos). Se generan variables indicadoras (z2, z3, z4) para los grupos 2, 3 y 4 respectivamente. Luego, se utiliza una PROC LOGISTIC para ajustar un modelo de regresión logística sobre la relación y/n con las variables indicadoras como predictores, sin corrección de escala inicial. Finalmente, se emplea una PROC NLMIXED para ajustar un modelo mixto no lineal, modelando la respuesta binomial con un efecto aleatorio ('u') por camada ('litter') para capturar la sobredispersión, estimando los parámetros alpha, beta2, beta3, beta4 y sigma.
Análisis de datos

Type : CREATION_INTERNE


Los datos se integran directamente en el script SAS a través de la instrucción 'cards' en el paso DATA, lo que significa que se crean internamente y no dependen de fuentes externas o bibliotecas SASHELP.

1 Bloque de código
DATA STEP Data
Explicación :
Este paso DATA crea un conjunto de datos llamado 'teratology'. Las variables 'litter' (camada), 'group' (grupo de tratamiento), 'n' (número total de individuos) e 'y' (número de individuos afectados) se leen de las líneas de datos ('cards'). Se crean tres variables indicadoras, z2, z3 y z4, para representar los grupos de tratamiento 2, 3 y 4 respectivamente. Si la variable 'group' es igual a 2, z2 toma el valor 1, y 0 en caso contrario. El mismo principio se aplica para z3 (group=3) y z4 (group=4), lo que facilita la inclusión de los grupos en los modelos estadísticos.
¡Copiado!
1DATA teratology;
2 INPUT litter group n y ;
3 z2=0; z3=0; z4=0;
4 IF group=2 THEN z2=1; IF group=3 THEN z3=1; IF group=4 THEN z4=1;
5CARDS;
6 1 1 10 1
7 2 1 11 4
8 3 1 12 9
9 4 1 4 4
10 5 1 10 10
11 6 1 11 9
12 7 1 9 9
13 8 1 11 11
14 9 1 10 10
15 10 1 10 7
16 11 1 12 12
17 12 1 10 9
18 13 1 8 8
19 14 1 11 9
20 15 1 6 4
21 16 1 9 7
22 17 1 14 14
23 18 1 12 7
24 19 1 11 9
25 20 1 13 8
26 21 1 14 5
27 22 1 10 10
28 23 1 12 10
29 24 1 13 8
30 25 1 10 10
31 26 1 14 3
32 27 1 13 13
33 28 1 4 3
34 29 1 8 8
35 30 1 13 5
36 31 1 12 12
37 32 2 10 1
38 33 2 3 1
39 34 2 13 1
40 35 2 12 0
41 36 2 14 4
42 37 2 9 2
43 38 2 13 2
44 39 2 16 1
45 40 2 11 0
46 41 2 4 0
47 42 2 1 0
48 43 2 12 0
49 44 3 8 0
50 45 3 11 1
51 46 3 14 0
52 47 3 14 1
53 48 3 11 0
54 49 4 3 0
55 50 4 13 0
56 51 4 9 2
57 52 4 17 2
58 53 4 15 0
59 54 4 2 0
60 55 4 14 1
61 56 4 8 0
62 57 4 6 0
63 58 4 17 0
64;
2 Bloque de código
PROC LOGISTIC
Explicación :
La PROC LOGISTIC se utiliza para ajustar un modelo de regresión logística. La cláusula 'model y/n' indica una variable de respuesta binomial donde 'y' es el número de 'éxitos' y 'n' es el número total de ensayos. Las variables z2, z3 y z4 son los predictores. La opción 'scale=none' se especifica para evitar el ajuste automático de la escala, lo cual es relevante al examinar la sobredispersión.
¡Copiado!
1 
2PROC LOGISTIC;
3 
4model y/n = z2 z3 z4 / scale=none;
5 
3 Bloque de código
PROC NLMIXED
Explicación :
La PROC NLMIXED se emplea para ajustar un modelo mixto no lineal. La opción 'qpoints=30' especifica el número de puntos de cuadratura para la integración numérica. Las ecuaciones 'eta' y 'p' definen la parte lineal y la probabilidad (a través de la función logit inversa) del modelo. La cláusula 'model y ~ binomial(n,p)' especifica que 'y' sigue una distribución binomial con 'n' ensayos y una probabilidad 'p'. Se incluye un efecto aleatorio 'u' y se supone que sigue una distribución normal con una media de 0 y una varianza 'sigma*sigma', agrupado por 'litter' (camada), lo que permite modelar la sobredispersión teniendo en cuenta la variabilidad entre las camadas.
¡Copiado!
1PROC NLMIXED qpoints=30;
2 eta = alpha + beta2*z2 + beta3*z3 + beta4*z4 + u ;
3 p = exp(eta)/(1 + exp(eta));
4 model y ~ binomial(n,p) ;
5 random u ~ normal(0, sigma*sigma) subject=litter;
6RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.