Publicado el :
Estadística CREATION_INTERNE

Análisis y Visualización de Datos Automovilísticos

Este código también está disponible en: Deutsch English Français
En espera de validación
El script comienza con la creación de un conjunto de datos temporal llamado 'auto' utilizando una instrucción DATA y datos integrados a través de CARDS. Este conjunto de datos contiene información sobre vehículos como la marca, el MPG, la fiabilidad (rep78), el peso y el origen (foreign1). Luego, utiliza PROC FREQ para obtener la distribución de frecuencias de la variable 'mpg'. Después de eso, inicializa las opciones gráficas globales. Se generan dos tipos de gráficos: una PROC PLOT simple para visualizar 'mpg' en función de 'weight1', y una PROC GPLOT más avanzada. La PROC GPLOT personalizada muestra la misma relación, pero agrega una distinción visual basada en la variable 'foreign1' (vehículo extranjero o no), define ejes específicos y calcula y muestra la ecuación de regresión (regeqn) para la línea ajustada.
Análisis de datos

Type : CREATION_INTERNE


Los datos se integran directamente en el script mediante una instrucción DATA con CARDS, creando el conjunto de datos temporal 'auto'.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque DATA STEP crea un conjunto de datos SAS temporal llamado 'auto'. Los datos se leen en línea utilizando la instrucción CARDS y definen las variables 'make' (carácter), 'mpg', 'rep78', 'weight1' y 'foreign1' (numéricas). 'mpg' representa el consumo, 'weight1' el peso y 'foreign1' indica si el coche es extranjero (1) o no (0).
¡Copiado!
1DATA auto ;
2 INPUT make $ mpg rep78 weight1 foreign1 ;
3CARDS;
4AMC 22 3 2930 0
5AMC 17 3 3350 0
6AMC 22 . 2640 0
7Audi 17 5 2830 1
8Audi 23 3 2070 1
9BMW 25 4 2650 1
10Buick 20 3 3250 0
11Buick 15 4 4080 0
12Buick 18 3 3670 0
13Buick 26 . 2230 0
14Buick 20 3 3280 0
15Buick 16 3 3880 0
16Buick 19 3 3400 0
17Cad. 14 3 4330 0
18Cad. 14 2 3900 0
19Cad. 21 3 4290 0
20Chev. 29 3 2110 0
21Chev. 16 4 3690 0
22Chev. 22 3 3180 0
23Chev. 22 2 3220 0
24Chev. 24 2 2750 0
25Chev. 19 3 3430 0
26Datsun 23 4 2370 1
27Datsun 35 5 2020 1
28Datsun 24 4 2280 1
29Datsun 21 4 2750 1
30;
31RUN;
2 Bloque de código
PROC FREQ
Explicación :
Este procedimiento genera una tabla de frecuencias para la variable 'mpg' del conjunto de datos 'auto'. Permite observar la distribución de los diferentes valores de consumo de combustible.
¡Copiado!
1PROC FREQ DATA = auto;
2 TABLES mpg;
3RUN;
3 Bloque de código
GOPTIONS
Explicación :
Esta instrucción restablece todas las opciones gráficas globales a sus valores predeterminados y agrega un borde a los gráficos generados. Esto asegura una base limpia para los gráficos siguientes.
¡Copiado!
1goptions reset=all border;
4 Bloque de código
PROC PLOT
Explicación :
Este procedimiento genera un diagrama de dispersión simple ('plot') de 'mpg' (eje Y) en función de 'weight1' (eje X) a partir del conjunto de datos 'auto'. Proporciona una primera visión visual de la relación entre estas dos variables.
¡Copiado!
1 
2PROC PLOT
3DATA=auto;
4plot mpg * weight1 ;
5 
6RUN;
7 
5 Bloque de código
PROC GPLOT
Explicación :
Este procedimiento genera un gráfico GPLOT más elaborado. Se define el título 'Study of MPG vs Weight'. La instrucción SYMBOL configura la visualización de los puntos y la línea de regresión (interpol=rqcli95 para una regresión cuadrática con intervalos de confianza del 95%, puntos en círculos, colores específicos). El gráfico representa 'mpg' en función de 'weight1', con los puntos coloreados de manera diferente según la variable 'foreign1'. Los ejes X e Y se personalizan con rangos e incrementos específicos, y la opción 'regeqn' muestra la ecuación de regresión en el gráfico.
¡Copiado!
1 PROC GPLOT DATA=auto;
2 title "Study of MPG vs Weight";
3
4symbol interpol= rqcli95
5 value=circle
6 cv= crimson
7 ci = black
8 co = bib
9 width= 2
10 ;
11
12 plot mpg*weight1 = foreign1 / haxis=2000 to 4500 BY 500
13 vaxis=12 to 35 BY 2
14 regeqn;
15
16RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : Author - Anupama Rajaram Program Description - Este programa crea un gráfico simple de 2 variables, dibuja la línea de trazado y calcula la ecuación de regresión. y-axis = mpg. x-axis = weight1.