Analyse de surdispersion en tératologie

L'analyse débute par la création d'un jeu de données 'teratology' interne. Les variables 'litter', 'group', 'n' (nombre total d'observations), et 'y' (nombre de succès) sont lues. Des variables indicatrices (z2, z3, z4) sont générées pour les groupes 2, 3 et 4 respectivement. Ensuite, une PROC LOGISTIC est utilisée pour ajuster un modèle de régression logistique sur le ratio y/n avec les variables indicatrices comme prédicteurs, sans correction d'échelle initiale. Enfin, une PROC NLMIXED est employée pour ajuster un modèle mixte non linéaire, modélisant la réponse binomiale avec un effet aléatoire ('u') par portée ('litter') pour capturer la surdispersion, en estimant les paramètres alpha, beta2, beta3, beta4 et sigma.

Analyse des données

Type : CREATION_INTERNE

Les données sont directement intégrées au script SAS via l'instruction 'cards' dans l'étape DATA, ce qui signifie qu'elles sont créées en interne et ne dépendent pas de sources externes ou de bibliothèques SASHELP.

1 Bloc de code

DATA STEP Data

Explication :
Cette étape DATA crée un jeu de données nommé 'teratology'. Les variables 'litter' (portée), 'group' (groupe de traitement), 'n' (nombre total d'individus) et 'y' (nombre d'individus affectés) sont lues à partir des lignes de données ('cards'). Trois variables indicatrices, z2, z3 et z4, sont créées pour représenter les groupes de traitement 2, 3 et 4 respectivement. Si la variable 'group' est égale à 2, z2 prend la valeur 1, et 0 sinon. Le même principe s'applique pour z3 (group=3) et z4 (group=4), ce qui facilite l'inclusion des groupes dans les modèles statistiques.

Copié !

1	DATA teratology;
2	INPUT litter group n y ;
3	z2=0; z3=0; z4=0;
4	IF group=2 THEN z2=1; IF group=3 THEN z3=1; IF group=4 THEN z4=1;
5	CARDS;
6	1 1 10 1
7	2 1 11 4
8	3 1 12 9
9	4 1 4 4
10	5 1 10 10
11	6 1 11 9
12	7 1 9 9
13	8 1 11 11
14	9 1 10 10
15	10 1 10 7
16	11 1 12 12
17	12 1 10 9
18	13 1 8 8
19	14 1 11 9
20	15 1 6 4
21	16 1 9 7
22	17 1 14 14
23	18 1 12 7
24	19 1 11 9
25	20 1 13 8
26	21 1 14 5
27	22 1 10 10
28	23 1 12 10
29	24 1 13 8
30	25 1 10 10
31	26 1 14 3
32	27 1 13 13
33	28 1 4 3
34	29 1 8 8
35	30 1 13 5
36	31 1 12 12
37	32 2 10 1
38	33 2 3 1
39	34 2 13 1
40	35 2 12 0
41	36 2 14 4
42	37 2 9 2
43	38 2 13 2
44	39 2 16 1
45	40 2 11 0
46	41 2 4 0
47	42 2 1 0
48	43 2 12 0
49	44 3 8 0
50	45 3 11 1
51	46 3 14 0
52	47 3 14 1
53	48 3 11 0
54	49 4 3 0
55	50 4 13 0
56	51 4 9 2
57	52 4 17 2
58	53 4 15 0
59	54 4 2 0
60	55 4 14 1
61	56 4 8 0
62	57 4 6 0
63	58 4 17 0
64	;

2 Bloc de code

PROC LOGISTIC

Explication :
La PROC LOGISTIC est utilisée pour ajuster un modèle de régression logistique. La clause 'model y/n' indique une variable de réponse binomiale où 'y' est le nombre de 'succès' et 'n' est le nombre total d'essais. Les variables z2, z3 et z4 sont les prédicteurs. L'option 'scale=none' est spécifiée pour éviter l'ajustement automatique de l'échelle, ce qui est pertinent lors de l'examen de la surdispersion.

Copié !

1
2	PROC LOGISTIC;
3
4	model y/n = z2 z3 z4 / scale=none;
5

3 Bloc de code

PROC NLMIXED

Explication :
La PROC NLMIXED est employée pour ajuster un modèle mixte non linéaire. L'option 'qpoints=30' spécifie le nombre de points de quadrature pour l'intégration numérique. Les équations 'eta' et 'p' définissent la partie linéaire et la probabilité (via la fonction logit inverse) du modèle. La clause 'model y ~ binomial(n,p)' spécifie que 'y' suit une distribution binomiale avec 'n' essais et une probabilité 'p'. Un effet aléatoire 'u' est inclus et supposé suivre une distribution normale avec une moyenne de 0 et une variance 'sigma*sigma', groupé par 'litter' (portée), ce qui permet de modéliser la surdispersion en tenant compte de la variabilité entre les portées.

Copié !

1	PROC NLMIXED qpoints=30;
2	eta = alpha + beta2z2 + beta3z3 + beta4*z4 + u ;
3	p = exp(eta)/(1 + exp(eta));
4	model y ~ binomial(n,p) ;
5	random u ~ normal(0, sigma*sigma) subject=litter;
6	RUN;

Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.

Retour à la liste