Publié le :
Statistique CREATION_INTERNE

Analyse de corrélation et régression sur données socio-économiques

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script débute par la création d'une table `SocEcon` contenant cinq variables socio-économiques via une étape DATA. Il procède ensuite au calcul d'une matrice de corrélation avec `PROC CORR`. Une seconde table de type CORR est aussi créée manuellement. Le cœur de l'analyse repose sur `PROC REG`, qui est utilisé à deux reprises : d'abord pour ajuster deux modèles de régression et sauvegarder leurs estimations et covariances (`OUTEST=regest COVOUT`), puis pour générer la matrice des sommes des carrés et produits croisés (`OUTSSCP=regsscp`). Les tables de résultats intermédiaires (`corrcorr`, `datacorr`, `regest`, `regsscp`) sont affichées avec `PROC PRINT` pour inspection.
Analyse des données

Type : CREATION_INTERNE


Les deux tables de données utilisées, `SocEcon` et `datacorr`, sont créées à l'intérieur du script en utilisant l'instruction `datalines`. Aucune source de données externe n'est nécessaire.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA STEP crée la table de travail `SocEcon`. Il lit 12 observations pour 5 variables socio-économiques (Pop, School, Employ, Services, House) directement depuis le code à l'aide de l'instruction `datalines`.
Copié !
1title 'Five Socioeconomic Variables';
2title2 'Harman (1976), Modern Factor Analysis, Third Edition';
3 
4DATA SocEcon;
5 INPUT Pop School Employ Services House;
6 DATALINES;
75700 12.8 2500 270 25000
81000 10.9 600 10 10000
93400 8.8 1000 10 9000
103800 13.6 1700 140 25000
114000 12.8 1600 140 25000
128200 8.3 2600 60 12000
131200 11.4 400 10 16000
149100 11.5 3300 60 14000
159900 12.5 3400 180 18000
169600 13.7 3600 390 25000
179600 9.6 3300 80 12000
189400 11.4 4000 100 13000
19;
20 
2 Bloc de code
PROC CORR Data
Explication :
La procédure `PROC CORR` calcule la matrice de corrélation pour toutes les variables numériques de la table `SocEcon`. L'option `noprint` supprime l'affichage dans la sortie standard, et `out=corrcorr` sauvegarde les résultats dans une nouvelle table nommée `corrcorr`. Cette table est ensuite affichée avec `PROC PRINT` et sa structure est inspectée avec `PROC CONTENTS`.
Copié !
1PROC CORR noprint out=corrcorr;
2RUN;
3 
4PROC PRINT DATA=corrcorr;
5RUN;
6 
7PROC CONTENTS DATA=corrcorr;
8RUN;
3 Bloc de code
DATA STEP Data
Explication :
Ce DATA STEP crée manuellement une table SAS spéciale de type CORR nommée `datacorr`. Ce type de table peut être utilisé en entrée par d'autres procédures statistiques. Les données de la matrice de corrélation sont lues depuis les `datalines`. La table résultante est affichée avec `PROC PRINT`.
Copié !
1title 'Five Socioeconomic Variables';
2 
3DATA datacorr(type=corr);
4 INFILE CARDS missover;
5 _type_='corr';
6 INPUT _Name_ $ Pop School Employ Services House;
7 DATALINES;
8Pop 1.00000
9School 0.00975 1.00000
10Employ 0.97245 0.15428 1.00000
11Services 0.43887 0.69141 0.51472 1.00000
12House 0.02241 0.86307 0.12193 0.77765 1.00000
13;
14 
15PROC PRINT DATA=datacorr;
16RUN;
4 Bloc de code
PROC REG Data
Explication :
Cette procédure `PROC REG` effectue deux analyses de régression linéaire sur la table `SocEcon`. Les résultats (estimations des paramètres) sont stockés dans la table `regest` grâce à `outest=regest`. L'option `covout` inclut la matrice de covariance des estimations. Les deux modèles, 'full' et 'empser', sont spécifiés. La table de résultats `regest` est ensuite imprimée.
Copié !
1PROC REG DATA=SocEcon outest=regest covout;
2 full: model house=pop school employ services / noprint;
3 empser: model house=employ services / noprint;
4QUIT;
5 
6PROC PRINT DATA=regest;
7RUN;
5 Bloc de code
PROC REG Data
Explication :
Une seconde exécution de `PROC REG` est utilisée pour générer la matrice des sommes des carrés et des produits croisés (SSCP) pour les variables du modèle. Le résultat est stocké dans la table `regsscp` via l'option `outsscp=regsscp`. La table `regsscp` est ensuite affichée pour vérification.
Copié !
1PROC REG DATA=SocEcon outsscp=regsscp;
2 model house=pop school employ services / noprint;
3QUIT;
4 
5PROC PRINT DATA=regsscp;
6RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.