Publié le :
Statistique CREATION_INTERNE

Analyse Statistique et Graphique de Données Biomédicales et Épidémiologiques

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script commence par la création du jeu de données 'Athelate' via des datalines, où une nouvelle variable (ABP - Pression Artérielle Moyenne) est calculée. Le contenu de ce jeu de données est ensuite affiché. Une copie, 'Practice.Athelate', est créée pour d'autres analyses. Des statistiques descriptives (moyennes, écarts-types) sont calculées et affichées pour les variables numériques de 'Athelate' via PROC MEANS. Plusieurs analyses univariées sont effectuées sur la variable 'Age' de 'Athelate' et 'Practice.Athelate', incluant des intervalles de confiance et des tests de normalité. La visualisation des données est ensuite abordée avec PROC SGPLOT pour générer des boxplots verticaux et horizontaux de la variable SBP, et PROC PLOT pour un nuage de points entre SBP et DBP, le tout pour le jeu de données 'Practice.Athelate'. Enfin, un second jeu de données 'disease' est créé via datalines pour analyser les fréquences croisées entre 'Severity' et 'Herd_size' en utilisant PROC FREQ, incluant des tests du Chi-deux.
Analyse des données

Type : CREATION_INTERNE


Tous les jeux de données principaux ('Athelate' et 'disease') sont créés directement dans le script SAS via des instructions DATALINES, intégrant les données brutes dans le code. Les jeux de données 'Practice.Athelate' et 'desp_athelate' sont des dérivations de ces données internes. Aucune source de données externe (fichiers CSV, bases de données, etc.) n'est directement lue par ce script.

1 Bloc de code
DATA STEP Data
Explication :
Crée le jeu de données SAS 'Athelate' en lisant les données fournies via l'instruction DATALINES. Il définit les variables Id, Age, Race (caractère), SBP, DBP, HR (numériques), et calcule une nouvelle variable 'ABP' (Pression Artérielle Moyenne) à partir de SBP et DBP.
Copié !
1DATA Athelate;
2INPUT Id Age Race $ SBP DBP HR;
3ABP=1/3*SBP+2/3*DBP;
4DATALINES;
54101 18 W 130 80 60
64102 18 W 140 90 70
74103 19 B 120 70 64
84104 17 B 150 90 76
94105 18 B 124 86 72
104106 19 W 145 94 70
114107 23 B 125 78 68
124108 21 W 140 85 74
134109 18 W 150 82 65
144110 20 W 145 95 75
15RUN;
2 Bloc de code
PROC PRINT
Explication :
Affiche le contenu du jeu de données 'Athelate'. L'option 'noobs' supprime l'affichage de la colonne d'observation numérique par défaut.
Copié !
1PROC PRINT DATA=Athelate noobs;
3 Bloc de code
DATA STEP Data
Explication :
Crée un nouveau jeu de données nommé 'Practice.Athelate' dans la bibliothèque 'Practice' (si elle est définie, sinon dans WORK) en copiant toutes les observations et variables du jeu de données 'Athelate'.
Copié !
1DATA Practice.Athelate;
2SET Athelate;
4 Bloc de code
PROC MEANS Data
Explication :
Calcule des statistiques descriptives (moyenne et écart-type) pour les variables 'Age', 'SBP', 'DBP', 'HR' du jeu de données 'Athelate'. Les résultats des moyennes et écarts-types pour 'Age' et 'SBP' sont sauvegardés dans un nouveau jeu de données 'desp_athelate'.
Copié !
1 
2PROC MEANS
3DATA=Athelate;
4var Age SBP DBP HR;
5OUTPUT out=desp_athelate mean=av_Age av_SBP std=sd_Age sd_SBP;
6 
5 Bloc de code
PROC PRINT
Explication :
Affiche le contenu du jeu de données 'desp_athelate', qui contient les statistiques descriptives calculées précédemment.
Copié !
1PROC PRINT DATA=desp_athelate;
6 Bloc de code
PROC UNIVARIATE
Explication :
Effectue une analyse univariée sur la variable 'Age' du jeu de données 'athelate'. Il calcule un intervalle de confiance basique (type=upper, alpha=0.10) et teste l'hypothèse nulle que la moyenne de 'Age' est égale à 120 (mu0=120).
Copié !
1 
2PROC UNIVARIATE
3DATA=athelate cibasic(type=upper alpha=0.10) mu0=120;
4var Age;
5 
7 Bloc de code
PROC UNIVARIATE
Explication :
Effectue une analyse univariée sur toutes les variables numériques du jeu de données 'athelate', en fournissant des statistiques descriptives et un intervalle de confiance basique par défaut pour la moyenne.
Copié !
1PROC UNIVARIATE DATA=athelate cibasic;
8 Bloc de code
PROC UNIVARIATE
Explication :
Réalise une analyse univariée sur la variable 'Age' du jeu de données 'Practice.Athelate'. L'option 'plots' génère des graphiques par défaut et 'normaltest' effectue des tests de normalité. L'instruction 'histogram' crée un histogramme de la variable 'Age'.
Copié !
1 
2PROC UNIVARIATE
3DATA=Practice.Athelate plots normaltest;
4var Age;
5histogram;
6 
9 Bloc de code
PROC SGPLOT
Explication :
Génère un boxplot vertical ('vbox') de la variable 'SBP' à partir du jeu de données 'practice.athelate'. La grille est activée sur l'axe des Y et un titre est défini pour le graphique.
Copié !
1PROC SGPLOT DATA=practice.athelate;
2vbox SBP;
3yaxis grid;
4title "Boxplot of SBP Variable From Athelate data";
10 Bloc de code
PROC SGPLOT
Explication :
Génère un boxplot horizontal ('hbox') de la variable 'SBP' à partir du jeu de données 'Practice.Athelate', avec un titre spécifique.
Copié !
1 
2PROC SGPLOT
3DATA=Practice.Athelate;
4hbox SBP;
5title "Horizontal Boxplot of SBP Variable From Athelate
6data";
7 
11 Bloc de code
PROC PLOT
Explication :
Crée un nuage de points ('scatterplot') des variables 'SBP' et 'DBP' à partir du jeu de données 'Practice.Athelate', avec 'SBP' sur l'axe des Y et 'DBP' sur l'axe des X, et un titre descriptif.
Copié !
1 
2PROC PLOT
3DATA=Practice.Athelate;
4plot SBP*DBP;
5title "Scatter plot of SBP and DBP Variable";
6 
12 Bloc de code
DATA STEP Data
Explication :
Crée le jeu de données SAS 'disease' en lisant les données fournies via l'instruction DATALINES. Il définit les variables 'Severity' (caractère), 'Herd_size' (caractère) et 'Count' (numérique).
Copié !
1DATA disease;
2INPUT Severity $ Herd_size $ Count ;
3DATALINES;
4a1 b1 11 a1 b2 88 a1 b3 136
5a2 b1 18 a2 b2 4 a2 b3 19
6a3 b1 9 a3 b2 5 a3 b3 9
7RUN;
13 Bloc de code
PROC PRINT
Explication :
Affiche le contenu du jeu de données 'disease'.
Copié !
1PROC PRINT DATA=disease;
14 Bloc de code
PROC FREQ
Explication :
Effectue une analyse de fréquences pour les variables 'Severity' et 'Herd_size' du jeu de données 'disease'. L'instruction 'weight count' indique que la variable 'count' représente la fréquence des observations. Le deuxième bloc 'tables' demande des statistiques supplémentaires, y compris le test du Chi-deux ('chisq'), et supprime l'affichage des pourcentages de colonne, de ligne et globaux ('nocol', 'nopercent', 'norow'), ainsi que les mesures d'association.
Copié !
1PROC FREQ;
2weight count;
3tables Severity*Herd_size;
4tables Severity*Herd_size / chisq nocol nopercent norow measures;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.