Publié le :
Statistique CREATION_INTERNE

Analyse de variance déséquilibrée avec PROC GLM

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le code commence par la création d'un jeu de données interne nommé 'a' via une instruction DATALINES, contenant les variables 'drug', 'disease' et 'y'. Des valeurs manquantes sont présentes, rendant l'analyse déséquilibrée. Trois exécutions successives de PROC GLM sont effectuées. La première analyse le modèle avec les facteurs 'drug', 'disease' et leur interaction, en demandant les sommes des carrés de type I, II, III et IV. La deuxième exécution est similaire mais ajoute la demande de moyennes des moindres carrés pour le facteur 'drug' avec toutes les comparaisons par paires ajustées selon la méthode de Tukey. La troisième exécution active ODS Graphics pour générer un graphique des moyennes avec intervalles de confiance ('meanplot(cl)'), et répète l'analyse des moyennes des moindres carrés.
Analyse des données

Type : CREATION_INTERNE


Les données brutes sont incluses directement dans le script SAS via une instruction DATALINES au sein d'une étape DATA, créant ainsi le jeu de données 'a'. Il n'y a pas de dépendances à des sources de données externes ou à des bibliothèques SAS préexistantes comme SASHELP pour l'ensemble de données principal.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc crée le jeu de données SAS nommé 'a'. Il lit les variables 'drug' (médicament) et 'disease' (maladie), puis utilise une boucle 'do i=1 to 6' pour lire six observations de la variable 'y' (réponse) par ligne d'entrée, créant ainsi six lignes pour chaque combinaison 'drug-disease' si les données sont complètes. L'instruction 'datalines' marque le début des données brutes intégrées directement dans le script. La présence de points ('.') indique des valeurs manquantes, ce qui rend la conception déséquilibrée.
Copié !
1DATA a;
2 INPUT drug disease @;
3 DO i=1 to 6;
4 INPUT y @;
5 OUTPUT;
6 END;
7 DATALINES;
81 1 42 44 36 13 19 22
91 2 33 . 26 . 33 21
101 3 31 -3 . 25 25 24
112 1 28 . 23 34 42 13
122 2 . 34 33 31 . 36
132 3 3 26 28 32 4 16
143 1 . . 1 29 . 19
153 2 . 11 9 7 1 -6
163 3 21 1 . 9 3 .
174 1 24 . 9 22 -2 15
184 2 27 12 12 -5 16 15
194 3 22 7 25 5 12 .
20;
2 Bloc de code
PROC GLM
Explication :
Ce bloc exécute la procédure GLM pour une analyse de variance. L'instruction 'class' déclare 'drug' et 'disease' comme variables catégorielles. L'instruction 'model' spécifie que 'y' est la variable dépendante et que 'drug', 'disease', ainsi que leur interaction 'drug*disease' sont les prédicteurs. Les options 'ss1', 'ss2', 'ss3', 'ss4' demandent le calcul des sommes des carrés de Type I, II, III et IV, qui sont pertinentes pour les modèles déséquilibrés et testent différents aspects des effets du modèle.
Copié !
1PROC GLM;
2 class drug disease;
3 model y=drug disease drug*disease / ss1 ss2 ss3 ss4;
4RUN;
3 Bloc de code
PROC GLM
Explication :
Ce second bloc PROC GLM est similaire au précédent, réaffirmant le modèle ANOVA déséquilibré. Il inclut en plus l'instruction 'lsmeans drug' qui calcule les moyennes des moindres carrés pour la variable 'drug'. L'option 'pdiff=all' demande toutes les comparaisons par paires entre les niveaux de 'drug', et 'adjust=tukey' applique l'ajustement de Tukey pour contrôler le taux d'erreur de la famille lors des comparaisons multiples, garantissant ainsi des inférences plus robustes.
Copié !
1PROC GLM;
2 class drug disease;
3 model y=drug disease drug*disease / ss1 ss2 ss3 ss4;
4 lsmeans drug / pdiff=all adjust=tukey;
5RUN;
4 Bloc de code
PROC GLM
Explication :
Ce troisième bloc PROC GLM active 'ods graphics on' pour générer des graphiques. L'option 'plot=meanplot(cl)' dans l'instruction 'proc glm' demande un graphique des moyennes avec des intervalles de confiance ('cl' pour confidence limits) pour les effets du modèle. Le modèle et les moyennes des moindres carrés ('lsmeans') sont spécifiés comme précédemment. L'instruction 'ods graphics off' désactive les graphiques ODS après l'exécution de la procédure. Ce bloc vise à fournir une visualisation des effets du modèle en plus des résultats tabulaires.
Copié !
1ods graphics on;
2PROC GLM plot=meanplot(cl);
3 class drug disease;
4 model y=drug disease drug*disease;
5 lsmeans drug / pdiff=all adjust=tukey;
6RUN;
7ods graphics off;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : S A S S A M P L E L I B R A R Y