Le script commence par la création du jeu de données 'Athelate' via des datalines, où une nouvelle variable (ABP - Pression Artérielle Moyenne) est calculée. Le contenu de ce jeu de données est ensuite affiché. Une copie, 'Practice.Athelate', est créée pour d'autres analyses. Des statistiques descriptives (moyennes, écarts-types) sont calculées et affichées pour les variables numériques de 'Athelate' via PROC MEANS. Plusieurs analyses univariées sont effectuées sur la variable 'Age' de 'Athelate' et 'Practice.Athelate', incluant des intervalles de confiance et des tests de normalité. La visualisation des données est ensuite abordée avec PROC SGPLOT pour générer des boxplots verticaux et horizontaux de la variable SBP, et PROC PLOT pour un nuage de points entre SBP et DBP, le tout pour le jeu de données 'Practice.Athelate'. Enfin, un second jeu de données 'disease' est créé via datalines pour analyser les fréquences croisées entre 'Severity' et 'Herd_size' en utilisant PROC FREQ, incluant des tests du Chi-deux.
Analyse des données
Type : CREATION_INTERNE
Tous les jeux de données principaux ('Athelate' et 'disease') sont créés directement dans le script SAS via des instructions DATALINES, intégrant les données brutes dans le code. Les jeux de données 'Practice.Athelate' et 'desp_athelate' sont des dérivations de ces données internes. Aucune source de données externe (fichiers CSV, bases de données, etc.) n'est directement lue par ce script.
1 Bloc de code
DATA STEP Data
Explication : Crée le jeu de données SAS 'Athelate' en lisant les données fournies via l'instruction DATALINES. Il définit les variables Id, Age, Race (caractère), SBP, DBP, HR (numériques), et calcule une nouvelle variable 'ABP' (Pression Artérielle Moyenne) à partir de SBP et DBP.
Copié !
data Athelate;
input Id Age Race $ SBP DBP HR;
ABP=1/3*SBP+2/3*DBP;
datalines;
4101 18 W 130 80 60
4102 18 W 140 90 70
4103 19 B 120 70 64
4104 17 B 150 90 76
4105 18 B 124 86 72
4106 19 W 145 94 70
4107 23 B 125 78 68
4108 21 W 140 85 74
4109 18 W 150 82 65
4110 20 W 145 95 75
run;
1
DATA Athelate;
2
INPUT Id Age Race $ SBP DBP HR;
3
ABP=1/3*SBP+2/3*DBP;
4
DATALINES;
5
410118 W 1308060
6
410218 W 1409070
7
410319 B 1207064
8
410417 B 1509076
9
410518 B 1248672
10
410619 W 1459470
11
410723 B 1257868
12
410821 W 1408574
13
410918 W 1508265
14
411020 W 1459575
15
RUN;
2 Bloc de code
PROC PRINT
Explication : Affiche le contenu du jeu de données 'Athelate'. L'option 'noobs' supprime l'affichage de la colonne d'observation numérique par défaut.
Copié !
proc print data=Athelate noobs;
1
PROC PRINTDATA=Athelate noobs;
3 Bloc de code
DATA STEP Data
Explication : Crée un nouveau jeu de données nommé 'Practice.Athelate' dans la bibliothèque 'Practice' (si elle est définie, sinon dans WORK) en copiant toutes les observations et variables du jeu de données 'Athelate'.
Copié !
data Practice.Athelate;
SET Athelate;
1
DATA Practice.Athelate;
2
SET Athelate;
4 Bloc de code
PROC MEANS Data
Explication : Calcule des statistiques descriptives (moyenne et écart-type) pour les variables 'Age', 'SBP', 'DBP', 'HR' du jeu de données 'Athelate'. Les résultats des moyennes et écarts-types pour 'Age' et 'SBP' sont sauvegardés dans un nouveau jeu de données 'desp_athelate'.
Copié !
proc means data=Athelate;
var Age SBP DBP HR;
output out=desp_athelate mean=av_Age av_SBP std=sd_Age sd_SBP;
Explication : Affiche le contenu du jeu de données 'desp_athelate', qui contient les statistiques descriptives calculées précédemment.
Copié !
proc print data=desp_athelate;
1
PROC PRINTDATA=desp_athelate;
6 Bloc de code
PROC UNIVARIATE
Explication : Effectue une analyse univariée sur la variable 'Age' du jeu de données 'athelate'. Il calcule un intervalle de confiance basique (type=upper, alpha=0.10) et teste l'hypothèse nulle que la moyenne de 'Age' est égale à 120 (mu0=120).
Copié !
proc univariate data=athelate cibasic(type=upper alpha=0.10) mu0=120;
var Age;
Explication : Effectue une analyse univariée sur toutes les variables numériques du jeu de données 'athelate', en fournissant des statistiques descriptives et un intervalle de confiance basique par défaut pour la moyenne.
Copié !
proc univariate data=athelate cibasic;
1
PROC UNIVARIATEDATA=athelate cibasic;
8 Bloc de code
PROC UNIVARIATE
Explication : Réalise une analyse univariée sur la variable 'Age' du jeu de données 'Practice.Athelate'. L'option 'plots' génère des graphiques par défaut et 'normaltest' effectue des tests de normalité. L'instruction 'histogram' crée un histogramme de la variable 'Age'.
Copié !
proc univariate data=Practice.Athelate plots normaltest;
var Age;
histogram;
1
2
PROC UNIVARIATE
3
DATA=Practice.Athelate plots normaltest;
4
var Age;
5
histogram;
6
9 Bloc de code
PROC SGPLOT
Explication : Génère un boxplot vertical ('vbox') de la variable 'SBP' à partir du jeu de données 'practice.athelate'. La grille est activée sur l'axe des Y et un titre est défini pour le graphique.
Copié !
proc sgplot data=practice.athelate;
vbox SBP;
yaxis grid;
title "Boxplot of SBP Variable From Athelate data";
1
PROC SGPLOTDATA=practice.athelate;
2
vbox SBP;
3
yaxis grid;
4
title "Boxplot of SBP Variable From Athelate data";
10 Bloc de code
PROC SGPLOT
Explication : Génère un boxplot horizontal ('hbox') de la variable 'SBP' à partir du jeu de données 'Practice.Athelate', avec un titre spécifique.
Copié !
proc sgplot data=Practice.Athelate;
hbox SBP;
title "Horizontal Boxplot of SBP Variable From Athelate data";
1
2
PROC SGPLOT
3
DATA=Practice.Athelate;
4
hbox SBP;
5
title "Horizontal Boxplot of SBP Variable From Athelate
6
data";
7
11 Bloc de code
PROC PLOT
Explication : Crée un nuage de points ('scatterplot') des variables 'SBP' et 'DBP' à partir du jeu de données 'Practice.Athelate', avec 'SBP' sur l'axe des Y et 'DBP' sur l'axe des X, et un titre descriptif.
Copié !
proc plot data=Practice.Athelate;
plot SBP*DBP;
title "Scatter plot of SBP and DBP Variable";
1
2
PROC PLOT
3
DATA=Practice.Athelate;
4
plot SBP*DBP;
5
title "Scatter plot of SBP and DBP Variable";
6
12 Bloc de code
DATA STEP Data
Explication : Crée le jeu de données SAS 'disease' en lisant les données fournies via l'instruction DATALINES. Il définit les variables 'Severity' (caractère), 'Herd_size' (caractère) et 'Count' (numérique).
Explication : Affiche le contenu du jeu de données 'disease'.
Copié !
proc print data=disease;
1
PROC PRINTDATA=disease;
14 Bloc de code
PROC FREQ
Explication : Effectue une analyse de fréquences pour les variables 'Severity' et 'Herd_size' du jeu de données 'disease'. L'instruction 'weight count' indique que la variable 'count' représente la fréquence des observations. Le deuxième bloc 'tables' demande des statistiques supplémentaires, y compris le test du Chi-deux ('chisq'), et supprime l'affichage des pourcentages de colonne, de ligne et globaux ('nocol', 'nopercent', 'norow'), ainsi que les mesures d'association.
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.