Publié le :
Statistique CREATION_INTERNE

Analyse de Données de Tératologie avec PROC GENMOD

Ce code est également disponible en : Deutsch English Español
Snippet validé
Le script commence par créer un jeu de données nommé 'teratology' via un DATA step et des données en ligne (`cards`). Ce jeu de données contient des informations sur des portées (litter), des groupes de traitement (group), le nombre total d'individus (n) et le nombre d'individus affectés (y). Des variables indicatrices (z2, z3, z4) sont créées pour les groupes 2, 3 et 4 afin d'être utilisées comme prédicteurs. Ensuite, la PROC GENMOD est utilisée pour ajuster un modèle linéaire généralisé avec une distribution binomiale et une fonction de lien logit. L'option `repeated` avec `subject=litter` et `type=exch corrw` est employée pour modéliser la corrélation intra-sujet (intra-litière), ce qui est une pratique courante dans les études de tératologie pour tenir compte de la non-indépendance des observations au sein de la même portée.
Analyse des données

Type : CREATION_INTERNE


Le jeu de données 'teratology' est créé directement dans le script SAS en utilisant un DATA step et des données brutes fournies via l'instruction `cards;`.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA step crée le jeu de données 'teratology' à partir de données brutes fournies directement dans le script. Les variables 'litter' (portée), 'group' (groupe de traitement), 'n' (nombre total d'individus) et 'y' (nombre d'individus affectés) sont lues. Les variables binaires 'z2', 'z3', 'z4' sont ensuite dérivées de la variable 'group' pour représenter les groupes de traitement 2, 3 et 4, respectivement. Ces variables serviront de prédicteurs dans l'analyse statistique.
Copié !
1DATA teratology;
2INPUT litter group n y ;
3 z2=0; z3=0; z4=0;
4 IF group=2 THEN z2=1; IF group=3 THEN z3=1; IF group=4 THEN z4=1;
5CARDS;
6 1 1 10 1
7 2 1 11 4
8 3 1 12 9
9 4 1 4 4
10 5 1 10 10
11 6 1 11 9
12 7 1 9 9
13 8 1 11 11
14 9 1 10 10
15 10 1 10 7
16 11 1 12 12
17 12 1 10 9
18 13 1 8 8
19 14 1 11 9
20 15 1 6 4
21 16 1 9 7
22 17 1 14 14
23 18 1 12 7
24 19 1 11 9
25 20 1 13 8
26 21 1 14 5
27 22 1 10 10
28 23 1 12 10
29 24 1 13 8
30 25 1 10 10
31 26 1 14 3
32 27 1 13 13
33 28 1 4 3
34 29 1 8 8
35 30 1 13 5
36 31 1 12 12
37 32 2 10 1
38 33 2 3 1
39 34 2 13 1
40 35 2 12 0
41 36 2 14 4
42 37 2 9 2
43 38 2 13 2
44 39 2 16 1
45 40 2 11 0
46 41 2 4 0
47 42 2 1 0
48 43 2 12 0
49 44 3 8 0
50 45 3 11 1
51 46 3 14 0
52 47 3 14 1
53 48 3 11 0
54 49 4 3 0
55 50 4 13 0
56 51 4 9 2
57 52 4 17 2
58 53 4 15 0
59 54 4 2 0
60 55 4 14 1
61 56 4 8 0
62 57 4 6 0
63 58 4 17 0
64;
2 Bloc de code
PROC GENMOD
Explication :
Ce bloc utilise la procédure GENMOD pour ajuster un modèle linéaire généralisé aux données de tératologie. L'option `DATA=teratology` spécifie le jeu de données d'entrée. `class litter;` déclare 'litter' comme une variable de classification, essentielle pour l'analyse des données répétées. L'instruction `model y/n= z2 z3 z4/dist=b link=logit;` spécifie que la réponse 'y' parmi 'n' essais suit une distribution binomiale (`dist=b`) avec une fonction de lien logit (`link=logit`), et que les prédicteurs sont 'z2', 'z3', et 'z4'. L'option `repeated subject=litter/type=exch corrw;` est cruciale pour modéliser la corrélation intra-sujet ou intra-litière, en supposant une structure de corrélation échangeable (`type=exch`) et en utilisant une matrice de corrélation de travail (`corrw`), ce qui est une approche standard pour ce type d'étude.
Copié !
1PROC GENMOD DATA= teratology;
2 class litter;
3 model y/n= z2 z3 z4/dist=b link=logit;
4 repeated subject=litter/type=exch corrw;
5RUN;
Résultat Visuel
Result
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Banner
Le Conseil de l'Expert
Expert
Stéphanie
Spécialiste Machine Learning et IA.
« Ne vous contentez pas d'analyser les groupes via vos variables indicatrices ($z2$, $z3$, etc.). Comparez toujours votre modèle REPEATED à un modèle logistique standard. Si les résultats diffèrent significativement, c'est que l'effet de portée était déterminant et que votre approche avec GENMOD a sauvé la validité de votre étude. »