Publié le :
Statistique CREATION_INTERNE

Analyse Descriptive de Variables Numériques

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script commence par créer un jeu de données SAS© nommé `heights`. Ce jeu de données est peuplé directement dans le code SAS© via une instruction `DATALINES`, définissant plusieurs variables numériques. Ensuite, la procédure `PROC UNIVARIATE` est utilisée pour effectuer une analyse statistique descriptive approfondie de la variable `lskew` issue du jeu de données `heights`. L'option `plot` est activée pour générer un ensemble complet de graphiques (histogramme, diagramme en boîte, Q-Q plot) qui sont essentiels pour l'évaluation visuelle de la distribution de la variable. Le script contient également des commentaires interprétatifs soulignant la non-normalité et l'asymétrie gauche de la distribution de `lskew`.
Analyse des données

Type : CREATION_INTERNE


Le jeu de données `heights` est créé directement dans le script SAS via une étape `DATA` utilisant des `datalines` pour l'entrée des données brutes. Il ne dépend d'aucune source de données externe (fichiers, bases de données) ni des bibliothèques SAS par défaut comme SASHELP.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc de code utilise une étape `DATA` pour créer un nouveau jeu de données SAS nommé `heights`. L'instruction `INPUT` définit les variables `id`, `uniform`, `actual`, `tails`, `middle`, `lskew`, et `rskew`. Les données pour ces variables sont fournies directement dans le script à l'aide de l'instruction `DATALINES`, ce qui signifie que les données sont intégrées au programme SAS lui-même.
Copié !
1DATA heights;
2 INPUT id uniform actual tails middle lskew rskew;
3 DATALINES;
401 71 75 62 62 65 67
502 71 72 62 63 65 68
603 71 72 62 65 65 70
704 71 72 62 66 64 68
805 71 72 62 67 62 67
906 71 74 62 69 69 69
1007 71 69 62 69 65 68
1108 71 69 62 69 68 70
1209 71 75 62 69 68 69
1310 71 75 62 70 70 70
1411 71 69 62 70 66 68
1512 71 72 62 70 70 67
1613 71 72 62 70 67 69
1714 71 75 62 70 68 68
1815 71 67 62 70 65 67
1916 71 67 62 71 72 70
2017 71 73 62 71 70 70
2118 71 69 62 71 72 70
2219 71 67 62 71 72 71
2320 71 67 62 71 72 70
2421 71 75 64 71 71 72
2522 71 72 64 71 71 71
2623 71 72 64 71 72 72
2724 71 75 66 71 70 71
2825 71 70 66 71 71 72
2926 71 70 76 71 70 70
3027 71 72 76 71 71 72
3128 71 73 78 71 72 70
3229 71 68 78 71 72 71
3330 71 71 78 71 70 72
3431 71 67 80 71 71 72
3532 71 70 80 71 71 71
3633 71 69 80 71 71 71
3734 71 64 80 71 71 71
3835 71 66 80 71 72 71
3936 71 66 80 72 74 75
4037 71 65 80 72 71 73
4138 71 64 80 72 72 76
4239 71 63 80 72 73 72
4340 71 66 80 72 73 77
4441 71 78 80 72 74 75
4542 71 76 80 73 74 75
4643 71 78 80 73 74 77
4744 71 76 80 73 72 72
4845 71 78 80 73 74 74
4946 71 77 80 74 74 79
5047 71 77 80 74 72 78
5148 71 71 80 75 74 79
5249 71 80 80 76 71 78
5350 71 62 80 79 73 80
54RUN;
2 Bloc de code
PROC UNIVARIATE
Explication :
Cette procédure `PROC UNIVARIATE` est utilisée pour générer des statistiques descriptives et des graphiques pour la variable `lskew` du jeu de données `heights`. L'option `PLOT` demande la production automatique d'un histogramme, d'un diagramme en boîte et d'un graphique Q-Q (quantiles-quantiles), permettant une évaluation visuelle de la forme de la distribution de la variable, de sa symétrie, de ses valeurs extrêmes et de sa normalité.
Copié !
1 
2PROC UNIVARIATE
3DATA = heights plot;
4var lskew;
5RUN;
6 
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : This code is posted for your benefit; however, I highly recommend that you practice typing your own SAS programs as well. With the SAS programming language, as with all new languages, immersion seems to be the best way to learn.


Banner
Le Conseil de l'Expert
Expert
Stéphanie
Spécialiste Machine Learning et IA.
« La force de la PROC UNIVARIATE réside dans sa capacité à fournir un audit complet de la santé statistique de vos données, bien au-delà de la simple moyenne. En activant l'option PLOT, vous générez une triade décisionnelle indispensable : l'histogramme pour la forme globale, le diagramme en boîte pour les valeurs aberrantes, et le Q-Q plot pour la normalité. Dans cet exemple, l'analyse de la variable lskew est cruciale car elle révèle une asymétrie gauche (negative skewness). Pour l'expert, cela signifie que la moyenne est entraînée vers le bas par des valeurs faibles, tandis que la majorité des observations se concentrent sur la droite. Ignorer cette non-normalité pourrait invalider des tests paramétriques classiques comme le test t de Student. »