Publicado el :
Statistique CREATION_INTERNE

Análisis de correlación y regresión en datos socioeconómicos

Este código también está disponible en: Deutsch English Français
En espera de validación
El script comienza con la creación de una tabla `SocEcon` que contiene cinco variables socioeconómicas a través de un paso DATA. Luego procede al cálculo de una matriz de correlación con `PROC CORR`. Una segunda tabla de tipo CORR también se crea manualmente. El núcleo del análisis se basa en `PROC REG`, que se utiliza dos veces: primero para ajustar dos modelos de regresión y guardar sus estimaciones y covarianzas (`OUTEST=regest COVOUT`), y luego para generar la matriz de sumas de cuadrados y productos cruzados (`OUTSSCP=regsscp`). Las tablas de resultados intermedias (`corrcorr`, `datacorr`, `regest`, `regsscp`) se muestran con `PROC PRINT` para su inspección.
Análisis de datos

Type : CREATION_INTERNE


Las dos tablas de datos utilizadas, `SocEcon` y `datacorr`, se crean dentro del script utilizando la instrucción `datalines`. No se necesita ninguna fuente de datos externa.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque DATA STEP crea la tabla de trabajo `SocEcon`. Lee 12 observaciones para 5 variables socioeconómicas (Pop, School, Employ, Services, House) directamente desde el código utilizando la instrucción `datalines`.
¡Copiado!
1title 'Five Socioeconomic Variables';
2title2 'Harman (1976), Modern Factor Analysis, Third Edition';
3 
4DATA SocEcon;
5 INPUT Pop School Employ Services House;
6 DATALINES;
75700 12.8 2500 270 25000
81000 10.9 600 10 10000
93400 8.8 1000 10 9000
103800 13.6 1700 140 25000
114000 12.8 1600 140 25000
128200 8.3 2600 60 12000
131200 11.4 400 10 16000
149100 11.5 3300 60 14000
159900 12.5 3400 180 18000
169600 13.7 3600 390 25000
179600 9.6 3300 80 12000
189400 11.4 4000 100 13000
19;
20 
2 Bloque de código
PROC CORR Data
Explicación :
El procedimiento `PROC CORR` calcula la matriz de correlación para todas las variables numéricas de la tabla `SocEcon`. La opción `noprint` suprime la visualización en la salida estándar, y `out=corrcorr` guarda los resultados en una nueva tabla llamada `corrcorr`. Esta tabla se muestra luego con `PROC PRINT` y su estructura se inspecciona con `PROC CONTENTS`.
¡Copiado!
1PROC CORR noprint out=corrcorr;
2RUN;
3 
4PROC PRINT DATA=corrcorr;
5RUN;
6 
7PROC CONTENTS DATA=corrcorr;
8RUN;
3 Bloque de código
DATA STEP Data
Explicación :
Este DATA STEP crea manualmente una tabla SAS especial de tipo CORR llamada `datacorr`. Este tipo de tabla puede ser utilizado como entrada por otros procedimientos estadísticos. Los datos de la matriz de correlación se leen desde las `datalines`. La tabla resultante se muestra con `PROC PRINT`.
¡Copiado!
1title 'Five Socioeconomic Variables';
2 
3DATA datacorr(type=corr);
4 INFILE CARDS missover;
5 _type_='corr';
6 INPUT _Name_ $ Pop School Employ Services House;
7 DATALINES;
8Pop 1.00000
9School 0.00975 1.00000
10Employ 0.97245 0.15428 1.00000
11Services 0.43887 0.69141 0.51472 1.00000
12House 0.02241 0.86307 0.12193 0.77765 1.00000
13;
14 
15PROC PRINT DATA=datacorr;
16RUN;
4 Bloque de código
PROC REG Data
Explicación :
Este procedimiento `PROC REG` realiza dos análisis de regresión lineal sobre la tabla `SocEcon`. Los resultados (estimaciones de los parámetros) se almacenan en la tabla `regest` gracias a `outest=regest`. La opción `covout` incluye la matriz de covarianza de las estimaciones. Se especifican los dos modelos, 'full' y 'empser'. La tabla de resultados `regest` se imprime a continuación.
¡Copiado!
1PROC REG DATA=SocEcon outest=regest covout;
2 full: model house=pop school employ services / noprint;
3 empser: model house=employ services / noprint;
4QUIT;
5 
6PROC PRINT DATA=regest;
7RUN;
5 Bloque de código
PROC REG Data
Explicación :
Una segunda ejecución de `PROC REG` se utiliza para generar la matriz de sumas de cuadrados y productos cruzados (SSCP) para las variables del modelo. El resultado se almacena en la tabla `regsscp` a través de la opción `outsscp=regsscp`. La tabla `regsscp` se muestra a continuación para verificación.
¡Copiado!
1PROC REG DATA=SocEcon outsscp=regsscp;
2 model house=pop school employ services / noprint;
3QUIT;
4 
5PROC PRINT DATA=regsscp;
6RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.