L'analyse débute par la création d'un jeu de données 'teratology' interne. Les variables 'litter', 'group', 'n' (nombre total d'observations), et 'y' (nombre de succès) sont lues. Des variables indicatrices (z2, z3, z4) sont générées pour les groupes 2, 3 et 4 respectivement. Ensuite, une PROC LOGISTIC est utilisée pour ajuster un modèle de régression logistique sur le ratio y/n avec les variables indicatrices comme prédicteurs, sans correction d'échelle initiale. Enfin, une PROC NLMIXED est employée pour ajuster un modèle mixte non linéaire, modélisant la réponse binomiale avec un effet aléatoire ('u') par portée ('litter') pour capturer la surdispersion, en estimant les paramètres alpha, beta2, beta3, beta4 et sigma.
Analyse des données
Type : CREATION_INTERNE
Les données sont directement intégrées au script SAS via l'instruction 'cards' dans l'étape DATA, ce qui signifie qu'elles sont créées en interne et ne dépendent pas de sources externes ou de bibliothèques SASHELP.
1 Bloc de code
DATA STEP Data
Explication : Cette étape DATA crée un jeu de données nommé 'teratology'. Les variables 'litter' (portée), 'group' (groupe de traitement), 'n' (nombre total d'individus) et 'y' (nombre d'individus affectés) sont lues à partir des lignes de données ('cards'). Trois variables indicatrices, z2, z3 et z4, sont créées pour représenter les groupes de traitement 2, 3 et 4 respectivement. Si la variable 'group' est égale à 2, z2 prend la valeur 1, et 0 sinon. Le même principe s'applique pour z3 (group=3) et z4 (group=4), ce qui facilite l'inclusion des groupes dans les modèles statistiques.
IF group=2THEN z2=1; IF group=3THEN z3=1; IF group=4THEN z4=1;
5
CARDS;
6
11101
7
21114
8
31129
9
4144
10
511010
11
61119
12
7199
13
811111
14
911010
15
101107
16
1111212
17
121109
18
13188
19
141119
20
15164
21
16197
22
1711414
23
181127
24
191119
25
201138
26
211145
27
2211010
28
2311210
29
241138
30
2511010
31
261143
32
2711313
33
28143
34
29188
35
301135
36
3111212
37
322101
38
33231
39
342131
40
35212 0
41
362144
42
37292
43
382132
44
392161
45
40211 0
46
4124 0
47
4221 0
48
43212 0
49
4438 0
50
453111
51
46314 0
52
473141
53
48311 0
54
4943 0
55
50413 0
56
51492
57
524172
58
53415 0
59
5442 0
60
554141
61
5648 0
62
5746 0
63
58417 0
64
;
2 Bloc de code
PROC LOGISTIC
Explication : La PROC LOGISTIC est utilisée pour ajuster un modèle de régression logistique. La clause 'model y/n' indique une variable de réponse binomiale où 'y' est le nombre de 'succès' et 'n' est le nombre total d'essais. Les variables z2, z3 et z4 sont les prédicteurs. L'option 'scale=none' est spécifiée pour éviter l'ajustement automatique de l'échelle, ce qui est pertinent lors de l'examen de la surdispersion.
Copié !
proc logistic;
model y/n = z2 z3 z4 / scale=none;
1
2
PROC LOGISTIC;
3
4
model y/n = z2 z3 z4 / scale=none;
5
3 Bloc de code
PROC NLMIXED
Explication : La PROC NLMIXED est employée pour ajuster un modèle mixte non linéaire. L'option 'qpoints=30' spécifie le nombre de points de quadrature pour l'intégration numérique. Les équations 'eta' et 'p' définissent la partie linéaire et la probabilité (via la fonction logit inverse) du modèle. La clause 'model y ~ binomial(n,p)' spécifie que 'y' suit une distribution binomiale avec 'n' essais et une probabilité 'p'. Un effet aléatoire 'u' est inclus et supposé suivre une distribution normale avec une moyenne de 0 et une variance 'sigma*sigma', groupé par 'litter' (portée), ce qui permet de modéliser la surdispersion en tenant compte de la variabilité entre les portées.
Copié !
proc nlmixed qpoints=30;
eta = alpha + beta2*z2 + beta3*z3 + beta4*z4 + u ;
p = exp(eta)/(1 + exp(eta));
model y ~ binomial(n,p) ;
random u ~ normal(0, sigma*sigma) subject=litter;
run;
1
PROC NLMIXED qpoints=30;
2
eta = alpha + beta2*z2 + beta3*z3 + beta4*z4 + u ;
3
p = exp(eta)/(1 + exp(eta));
4
model y ~ binomial(n,p) ;
5
random u ~ normal(0, sigma*sigma) subject=litter;
6
RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.