simple

correlation

Description

L'action `correlation` calcule les coefficients de corrélation produit-moment de Pearson, une mesure de la force et de la direction de l'association linéaire entre deux variables continues. Elle peut également calculer d'autres statistiques associées comme la covariance, la somme des carrés et des produits croisés (SSCP), et l'alpha de Cronbach.

simple.correlation / table={name='ma_table'} inputs={{name='var1'}, {name='var2'}} casOut={name='table_resultats', replace=true};
Paramètres
ParamètreDescription
alpha Si défini sur true, calcule le coefficient alpha de Cronbach pour évaluer la cohérence interne des échelles.
attributes Spécifie les attributs (comme le format ou le libellé) pour les variables de la table de sortie.
casOut Spécifie la table de sortie pour stocker les résultats de la corrélation.
covariance Si défini sur true, génère la matrice de variance-covariance.
csscp Si défini sur true, génère la matrice des sommes corrigées des carrés et des produits croisés.
descriptiveStats Si défini sur true, calcule les statistiques descriptives univariées pour les variables d'analyse.
display Permet de personnaliser les tables de résultats qui sont affichées sur le client.
excludeNonPosWgt Si défini sur true, exclut les observations avec une valeur de poids non positive.
excludePairStats Si défini sur true, supprime l'affichage des statistiques associées à la suppression par paire des valeurs manquantes.
excludeProbs Si défini sur true, supprime le calcul des probabilités (p-values) associées aux coefficients de corrélation.
freq Spécifie une variable numérique de fréquence pour chaque observation.
groupByLimit Spécifie le nombre maximum de niveaux à traiter pour les variables de regroupement (BY).
groupbyTable Spécifie une table d'entrée contenant les groupes à utiliser pour une analyse BY.
inputs Spécifie les variables numériques à inclure dans l'analyse de corrélation.
listwiseDelMiss Si défini sur true, utilise la suppression listwise pour les observations avec des valeurs manquantes.
outputTables Liste les noms des tables de résultats à sauvegarder en tant que tables CAS sur le serveur.
pairWithInput Spécifie des variables numériques à corréler avec les variables définies dans le paramètre `inputs`.
pearsonOut Spécifie une table de sortie pour contenir les statistiques de corrélation de Pearson.
rank Si défini sur true, affiche les coefficients de corrélation ordonnés.
sscp Si défini sur true, génère la matrice des sommes des carrés et des produits croisés.
table Spécifie la table CAS d'entrée pour l'analyse.
topCorrelation Spécifie le nombre de paires de corrélations les plus élevées à afficher.
varianceDivisor Spécifie le diviseur à utiliser dans le calcul de la variance (DF, N, WDF, WEIGHT).
varInfo Si défini sur true, crée une table d'informations sur les variables utilisées.
weight Spécifie une variable numérique de pondération.
Préparation des Données Voir la fiche de ce code dataprep
Création des données pour l'exemple

Ce code charge la table `CARS` de la bibliothèque `SASHELP` dans une table CAS nommée `CARS_CORR`. Nous ne conservons que quelques variables numériques pertinentes pour l'analyse de corrélation.

Copié !
1 
2DATA casuser.CARS_CORR;
3SET sashelp.cars;
4keep MPG_City MPG_Highway Weight Horsepower;
5 
6RUN;
7 

Exemples

Cet exemple calcule la matrice de corrélation de Pearson pour toutes les variables numériques de la table `CARS_CORR` et affiche les statistiques descriptives simples.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.correlation / TABLE={name='CARS_CORR'};
4 
5RUN;
6 
Résultat :
La sortie affichera les statistiques descriptives pour chaque variable, suivies de la matrice de corrélation de Pearson montrant la relation linéaire entre chaque paire de variables.

Calcule la corrélation uniquement pour les variables spécifiées dans `inputs`. L'option `covariance=true` demande la matrice de covariance, et `casOut` sauvegarde la matrice de corrélation dans une nouvelle table CAS nommée `CORR_RESULTS`.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.correlation / TABLE={name='CARS_CORR'}, inputs={{name='MPG_City'}, {name='MPG_Highway'}, {name='Weight'}}, covariance=true, casOut={name='CORR_RESULTS', replace=true};
4 
5RUN;
6 
Résultat :
Les résultats incluront les statistiques descriptives, la matrice de covariance, et la matrice de corrélation pour les variables spécifiées. Une nouvelle table CAS `CORR_RESULTS` sera créée dans la caslib active, contenant la matrice de corrélation.

Cet exemple utilise la variable `Horsepower` comme poids (`weight`) pour le calcul des corrélations. Il calcule également l'alpha de Cronbach (`alpha=true`) pour évaluer la fiabilité des variables d'entrée comme une échelle.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.correlation / TABLE={name='CARS_CORR'}, inputs={{name='MPG_City'}, {name='MPG_Highway'}, {name='Weight'}}, weight='Horsepower', alpha=true;
4 
5RUN;
6 
Résultat :
La sortie affichera les statistiques descriptives pondérées, la matrice de corrélation pondérée, et les statistiques de l'alpha de Cronbach (brut et standardisé) pour les variables d'analyse.

FAQ

À quoi sert l'action `simple.correlation` dans SAS Viya?
Quels types de statistiques peuvent être calculés avec l'action `correlation`?
Comment spécifier les variables à analyser?
Comment l'action `correlation` gère-t-elle les valeurs manquantes?
Est-il possible de pondérer les observations lors du calcul des corrélations?
Comment puis-je sauvegarder les résultats dans une table CAS?
Qu'est-ce que le paramètre `varianceDivisor` (ou `varDef`)?

Scénarios associés

Cas d'usage
Analyse de corrélation des indicateurs économiques

Une banque souhaite ajuster ses modèles de risque en analysant les corrélations historiques entre le PIB, le taux d'inflation et le taux de défaut de paiement des crédits à la c...

Cas d'usage
Analyse volumétrique capteurs vs pannes (Pondérée)

Une usine intelligente collecte des données de capteurs (Température, Vibration). On cherche à corréler ces métriques avec un indicateur binaire de panne ('FailureFlag'). Les do...

Cas d'usage
Cas limite : Données manquantes et Alpha de Cronbach

Dans un essai clinique, on évalue la cohérence interne d'un questionnaire de satisfaction patient (Q1, Q2, Q3). Le jeu de données est incomplet (patients n'ayant pas répondu à t...