Veröffentlicht am :
Statistik CREATION_INTERNE

Analyse und Visualisierung von Automobildaten

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript beginnt mit der Erstellung eines temporären Datensatzes namens 'auto' mithilfe einer DATA-Anweisung und eingebetteter Daten über CARDS. Dieser Datensatz enthält Fahrzeuginformationen wie Marke, MPG, Zuverlässigkeit (rep78), Gewicht und Herkunft (foreign1). Anschließend wird PROC FREQ verwendet, um die Häufigkeitsverteilung der Variable 'mpg' zu erhalten. Danach werden die globalen Grafikoptionen initialisiert. Es werden zwei Arten von Grafiken generiert: eine einfache PROC PLOT zur Visualisierung von 'mpg' in Abhängigkeit von 'weight1' und eine erweiterte PROC GPLOT. Die angepasste PROC GPLOT zeigt die gleiche Beziehung, fügt jedoch eine visuelle Unterscheidung basierend auf der Variable 'foreign1' (ausländisches Fahrzeug oder nicht) hinzu, definiert spezifische Achsen und berechnet sowie zeigt die Regressionsgleichung (regeqn) für die angepasste Linie an.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden direkt über eine DATA-Anweisung mit CARDS in das Skript integriert, wodurch der temporäre Datensatz 'auto' erstellt wird.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP-Block erstellt einen temporären SAS-Datensatz namens 'auto'. Die Daten werden inline mit der CARDS-Anweisung gelesen und definieren die Variablen 'make' (Zeichen), 'mpg', 'rep78', 'weight1' und 'foreign1' (numerisch). 'mpg' stellt den Verbrauch dar, 'weight1' das Gewicht und 'foreign1' gibt an, ob das Auto ausländisch (1) oder nicht (0) ist.
Kopiert!
1DATA auto ;
2 INPUT make $ mpg rep78 weight1 foreign1 ;
3CARDS;
4AMC 22 3 2930 0
5AMC 17 3 3350 0
6AMC 22 . 2640 0
7Audi 17 5 2830 1
8Audi 23 3 2070 1
9BMW 25 4 2650 1
10Buick 20 3 3250 0
11Buick 15 4 4080 0
12Buick 18 3 3670 0
13Buick 26 . 2230 0
14Buick 20 3 3280 0
15Buick 16 3 3880 0
16Buick 19 3 3400 0
17Cad. 14 3 4330 0
18Cad. 14 2 3900 0
19Cad. 21 3 4290 0
20Chev. 29 3 2110 0
21Chev. 16 4 3690 0
22Chev. 22 3 3180 0
23Chev. 22 2 3220 0
24Chev. 24 2 2750 0
25Chev. 19 3 3430 0
26Datsun 23 4 2370 1
27Datsun 35 5 2020 1
28Datsun 24 4 2280 1
29Datsun 21 4 2750 1
30;
31RUN;
2 Codeblock
PROC FREQ
Erklärung :
Diese Prozedur generiert eine Häufigkeitstabelle für die Variable 'mpg' aus dem Datensatz 'auto'. Sie ermöglicht die Beobachtung der Verteilung der verschiedenen Kraftstoffverbrauchswerte.
Kopiert!
1PROC FREQ DATA = auto;
2 TABLES mpg;
3RUN;
3 Codeblock
GOPTIONS
Erklärung :
Diese Anweisung setzt alle globalen Grafikoptionen auf ihre Standardwerte zurück und fügt den generierten Grafiken einen Rahmen hinzu. Dies gewährleistet eine saubere Basis für die folgenden Grafiken.
Kopiert!
1goptions reset=all border;
4 Codeblock
PROC PLOT
Erklärung :
Diese Prozedur generiert ein einfaches Streudiagramm ('plot') von 'mpg' (Y-Achse) in Abhängigkeit von 'weight1' (X-Achse) aus dem Datensatz 'auto'. Sie bietet einen ersten visuellen Überblick über die Beziehung zwischen diesen beiden Variablen.
Kopiert!
1 
2PROC PLOT
3DATA=auto;
4plot mpg * weight1 ;
5 
6RUN;
7 
5 Codeblock
PROC GPLOT
Erklärung :
Diese Prozedur generiert eine komplexere GPLOT-Grafik. Der Titel 'Study of MPG vs Weight' wird festgelegt. Die SYMBOL-Anweisung konfiguriert die Anzeige der Punkte und der Regressionslinie (interpol=rqcli95 für eine quadratische Regression mit 95%-Konfidenzintervallen, Punkte als Kreise, spezifische Farben). Die Grafik stellt 'mpg' in Abhängigkeit von 'weight1' dar, wobei die Punkte je nach Variable 'foreign1' unterschiedlich gefärbt sind. Die X- und Y-Achsen werden mit spezifischen Bereichen und Inkrementen angepasst, und die Option 'regeqn' zeigt die Regressionsgleichung in der Grafik an.
Kopiert!
1 PROC GPLOT DATA=auto;
2 title "Study of MPG vs Weight";
3
4symbol interpol= rqcli95
5 value=circle
6 cv= crimson
7 ci = black
8 co = bib
9 width= 2
10 ;
11
12 plot mpg*weight1 = foreign1 / haxis=2000 to 4500 BY 500
13 vaxis=12 to 35 BY 2
14 regeqn;
15
16RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Author - Anupama Rajaram Program Description - This program creates a simple gplot of 2 variables, draws the plot line and calculates regression equation. y-axis = mpg. x-axis = weight1.