Publié le :
Statistique CREATION_INTERNE

Analyse et Visualisation de Données Automobiles

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script débute par la création d'un jeu de données temporaire nommé 'auto' à l'aide d'une instruction DATA et de données intégrées via CARDS. Ce jeu de données contient des informations sur des véhicules telles que la marque, le MPG, la fiabilité (rep78), le poids et l'origine (foreign1). Ensuite, il utilise PROC FREQ pour obtenir la distribution des fréquences de la variable 'mpg'. Après cela, il initialise les options graphiques globales. Deux types de graphiques sont générés : une PROC PLOT simple pour visualiser 'mpg' en fonction de 'weight1', et une PROC GPLOT plus avancée. La PROC GPLOT personnalisée affiche la même relation, mais ajoute une distinction visuelle basée sur la variable 'foreign1' (véhicule étranger ou non), définit des axes spécifiques, et calcule ainsi qu'affiche l'équation de régression (regeqn) pour la ligne ajustée.
Analyse des données

Type : CREATION_INTERNE


Les données sont directement intégrées dans le script via une instruction DATA avec CARDS, créant le jeu de données temporaire 'auto'.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA STEP crée un jeu de données SAS temporaire nommé 'auto'. Les données sont lues en ligne à l'aide de l'instruction CARDS et définissent les variables 'make' (caractère), 'mpg', 'rep78', 'weight1' et 'foreign1' (numériques). 'mpg' représente la consommation, 'weight1' le poids et 'foreign1' indique si la voiture est étrangère (1) ou non (0).
Copié !
1DATA auto ;
2 INPUT make $ mpg rep78 weight1 foreign1 ;
3CARDS;
4AMC 22 3 2930 0
5AMC 17 3 3350 0
6AMC 22 . 2640 0
7Audi 17 5 2830 1
8Audi 23 3 2070 1
9BMW 25 4 2650 1
10Buick 20 3 3250 0
11Buick 15 4 4080 0
12Buick 18 3 3670 0
13Buick 26 . 2230 0
14Buick 20 3 3280 0
15Buick 16 3 3880 0
16Buick 19 3 3400 0
17Cad. 14 3 4330 0
18Cad. 14 2 3900 0
19Cad. 21 3 4290 0
20Chev. 29 3 2110 0
21Chev. 16 4 3690 0
22Chev. 22 3 3180 0
23Chev. 22 2 3220 0
24Chev. 24 2 2750 0
25Chev. 19 3 3430 0
26Datsun 23 4 2370 1
27Datsun 35 5 2020 1
28Datsun 24 4 2280 1
29Datsun 21 4 2750 1
30;
31RUN;
2 Bloc de code
PROC FREQ
Explication :
Cette procédure génère un tableau de fréquences pour la variable 'mpg' du jeu de données 'auto'. Elle permet d'observer la distribution des différentes valeurs de consommation de carburant.
Copié !
1PROC FREQ DATA = auto;
2 TABLES mpg;
3RUN;
3 Bloc de code
GOPTIONS
Explication :
Cette instruction réinitialise toutes les options graphiques globales à leurs valeurs par défaut et ajoute une bordure aux graphiques générés. Cela assure une base propre pour les graphiques suivants.
Copié !
1goptions reset=all border;
4 Bloc de code
PROC PLOT
Explication :
Cette procédure génère un diagramme de dispersion simple ('plot') de 'mpg' (axe Y) en fonction de 'weight1' (axe X) à partir du jeu de données 'auto'. Elle donne un premier aperçu visuel de la relation entre ces deux variables.
Copié !
1 
2PROC PLOT
3DATA=auto;
4plot mpg * weight1 ;
5 
6RUN;
7 
5 Bloc de code
PROC GPLOT
Explication :
Cette procédure génère un graphique GPLOT plus élaboré. Le titre 'Study of MPG vs Weight' est défini. L'instruction SYMBOL configure l'affichage des points et la ligne de régression (interpol=rqcli95 pour une régression quadratique avec intervalles de confiance à 95%, points en cercles, couleurs spécifiques). Le graphique représente 'mpg' en fonction de 'weight1', avec les points colorés différemment selon la variable 'foreign1'. Les axes X et Y sont personnalisés avec des plages et des incréments spécifiques, et l'option 'regeqn' affiche l'équation de régression sur le graphique.
Copié !
1 PROC GPLOT DATA=auto;
2 title "Study of MPG vs Weight";
3
4symbol interpol= rqcli95
5 value=circle
6 cv= crimson
7 ci = black
8 co = bib
9 width= 2
10 ;
11
12 plot mpg*weight1 = foreign1 / haxis=2000 to 4500 BY 500
13 vaxis=12 to 35 BY 2
14 regeqn;
15
16RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Author - Anupama Rajaram Program Description - This program creates a simple gplot of 2 variables, draws the plot line and calculates regression equation. y-axis = mpg. x-axis = weight1.