Le script est une suite d'exemples d'analyses statistiques. Pour chaque exemple, un jeu de données est d'abord créé via une étape DATA avec des données internes (CARDS). Ensuite, des procédures de visualisation comme PROC BOXPLOT et PROC SGPLOT sont utilisées pour explorer les relations entre les variables. Le cœur de l'analyse repose sur PROC GLM (General Linear Models) qui est utilisée pour effectuer : 1) Une ANOVA pour tester l'effet d'une variable de classification sur une variable de réponse. 2) Une ANCOVA pour faire de même en ajustant l'effet pour une variable continue (covariable). Les moyennes ajustées (LSMEANS) sont calculées pour comparer les groupes. Ce processus est répété pour plusieurs jeux de données nommés medicine, data1, edu, na, et sale.
Analyse des données
Type : CREATION_INTERNE
Tous les jeux de données (medicine, data1, edu, na, sale) sont créés et peuplés directement dans le script à l'aide d'étapes DATA et de l'instruction CARDS/DATALINES. Aucune donnée externe n'est requise.
1 Bloc de code
DATA STEP Data
Explication : Création de la table 'medicine'. L'option '@@' dans l'instruction INPUT indique à SAS de lire plusieurs observations à partir d'une même ligne de données.
Explication : Tri du jeu de données 'medicine' en fonction de la variable de traitement 'trt'. Cette étape est souvent un prérequis pour les analyses 'BY-group'.
Copié !
proc sort data=medicine;
by trt;
run;
1
PROC SORTDATA=medicine;
2
BY trt;
3
RUN;
3 Bloc de code
PROC BOXPLOT
Explication : Génération de boîtes à moustaches (boxplots) pour visualiser la distribution de la variable 'y' pour chaque groupe de traitement 'trt'.
Copié !
proc boxplot data=medicine;
plot y*trt;
run;
1
PROC BOXPLOTDATA=medicine;
2
plot y*trt;
3
RUN;
4 Bloc de code
PROC SGPLOT
Explication : Création d'un nuage de points pour visualiser la relation entre les variables 'x' et 'y', en différenciant les points par groupe de traitement 'trt'.
Explication : Analyse de variance (ANOVA). Ce bloc teste si la moyenne de la variable de réponse 'y' diffère significativement entre les groupes définis par 'trt'. LSMEANS avec TDIFF compare les moyennes de chaque paire de groupes.
Copié !
PROC GLM data=medicine ;
CLASS trt;
MODEL y=trt /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=medicine ;
2
CLASS trt;
3
MODEL y=trt /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
6 Bloc de code
PROC GLM
Explication : Analyse de covariance (ANCOVA). Ce modèle teste les différences de 'y' entre les groupes 'trt' tout en contrôlant l'effet de la covariable continue 'x'.
Copié !
PROC GLM data=medicine ;
CLASS trt;
MODEL y=trt x /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=medicine ;
2
CLASS trt;
3
MODEL y=trt x /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
7 Bloc de code
DATA STEP Data
Explication : Création d'un second jeu de données 'data1' avec une variable de traitement textuelle ('A', 'B') et deux variables numériques.
Copié !
data data1;
input trt $ x y;
cards;
A 5 20
A 10 23
A 12 30
A 9 25
A 23 34
A 21 40
A 14 27
A 18 38
A 6 24
A 13 31
B 7 19
B 12 26
B 27 33
B 24 35
B 18 30
B 22 31
B 26 34
B 21 28
B 14 23
B 9 22
;
RUN;
1
DATA data1;
2
INPUT trt $ x y;
3
CARDS;
4
A 520
5
A 1023
6
A 1230
7
A 925
8
A 2334
9
A 2140
10
A 1427
11
A 1838
12
A 624
13
A 1331
14
B 719
15
B 1226
16
B 2733
17
B 2435
18
B 1830
19
B 2231
20
B 2634
21
B 2128
22
B 1423
23
B 922
24
;
25
RUN;
8 Bloc de code
PROC GLM
Explication : Exécution d'une analyse de covariance (ANCOVA) sur le jeu de données 'data1' pour évaluer l'effet de 'trt' sur 'y' en ajustant pour 'x'.
Copié !
PROC GLM data=data1 ;
CLASS trt;
MODEL y=trt x /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=data1 ;
2
CLASS trt;
3
MODEL y=trt x /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
9 Bloc de code
DATA STEP Data
Explication : Création du jeu de données 'edu' pour comparer différentes méthodes. L'option '@@' permet de lire plusieurs observations par ligne.
Explication : Analyse de covariance (ANCOVA) sur la table 'edu' pour comparer l'effet des 'method' sur 'y' en contrôlant pour 'x'.
Copié !
PROC GLM data=edu ;
CLASS method;
MODEL y=method x /SOLUTION;
LSMEANS method/TDIFF;
RUN;
1
PROC GLMDATA=edu ;
2
CLASS method;
3
MODEL y=method x /SOLUTION;
4
LSMEANS method/TDIFF;
5
RUN;
11 Bloc de code
DATA STEP Data
Explication : Création de la table 'na' avec trois groupes de traitement (A, B, C).
Copié !
DATA na;
input trt $ x y @@;
cards;
A 11 6 A 8 0 A 5 2 A 14 8 A 19 11 A 6 4 A 10 13 A 6 1 A 11 8 A 3 0
B 6 0 B 6 2 B 7 3 B 8 1 B 18 18 B 8 4 B 19 14 B 8 9 B 5 1 B 15 9
C 16 13 C 13 10 C 11 18 C 9 5 C 21 23 C 16 12 C 12 5 C 12 16 C 7 1 C 12 20
;
RUN;
1
DATA na;
2
INPUT trt $ x y @@;
3
CARDS;
4
A 116 A 8 0 A 52 A 148 A 1911 A 64 A 1013 A 61 A 118 A 3 0
5
B 6 0 B 62 B 73 B 81 B 1818 B 84 B 1914 B 89 B 51 B 159
6
C 1613 C 1310 C 1118 C 95 C 2123 C 1612 C 125 C 1216 C 71 C 1220
7
;
8
RUN;
12 Bloc de code
PROC GLM
Explication : Analyse de covariance (ANCOVA) sur les données 'na'.
Copié !
PROC GLM data=na ;
CLASS trt;
MODEL y=trt x /SOLUTION;
LSMEANS trt/TDIFF;
RUN;
1
PROC GLMDATA=na ;
2
CLASS trt;
3
MODEL y=trt x /SOLUTION;
4
LSMEANS trt/TDIFF;
5
RUN;
13 Bloc de code
DATA STEP Data
Explication : Création du dernier jeu de données d'exemple, 'sale'.
Explication : Analyse de covariance finale sur la table 'sale' pour évaluer l'effet du 'type' sur 'y' en ajustant pour la covariable 'x'.
Copié !
PROC GLM data=sale ;
CLASS type;
MODEL y=type x /SOLUTION;
LSMEANS type/TDIFF;
RUN;
1
PROC GLMDATA=sale ;
2
CLASS type;
3
MODEL y=type x /SOLUTION;
4
LSMEANS type/TDIFF;
5
RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.