simple

correlation

Description

L'action `correlation` calcule les coefficients de corrélation produit-moment de Pearson, une mesure de la force et de la direction de l'association linéaire entre deux variables continues. Elle peut également calculer d'autres statistiques associées comme la covariance, la somme des carrés et des produits croisés (SSCP), et l'alpha de Cronbach.

simple.correlation / table={name='ma_table'} inputs={{name='var1'}, {name='var2'}} casOut={name='table_resultats', replace=true};
Paramètres
ParamètreDescription
alphaSi défini sur true, calcule le coefficient alpha de Cronbach pour évaluer la cohérence interne des échelles.
attributesSpécifie les attributs (comme le format ou le libellé) pour les variables de la table de sortie.
casOutSpécifie la table de sortie pour stocker les résultats de la corrélation.
covarianceSi défini sur true, génère la matrice de variance-covariance.
csscpSi défini sur true, génère la matrice des sommes corrigées des carrés et des produits croisés.
descriptiveStatsSi défini sur true, calcule les statistiques descriptives univariées pour les variables d'analyse.
displayPermet de personnaliser les tables de résultats qui sont affichées sur le client.
excludeNonPosWgtSi défini sur true, exclut les observations avec une valeur de poids non positive.
excludePairStatsSi défini sur true, supprime l'affichage des statistiques associées à la suppression par paire des valeurs manquantes.
excludeProbsSi défini sur true, supprime le calcul des probabilités (p-values) associées aux coefficients de corrélation.
freqSpécifie une variable numérique de fréquence pour chaque observation.
groupByLimitSpécifie le nombre maximum de niveaux à traiter pour les variables de regroupement (BY).
groupbyTableSpécifie une table d'entrée contenant les groupes à utiliser pour une analyse BY.
inputsSpécifie les variables numériques à inclure dans l'analyse de corrélation.
listwiseDelMissSi défini sur true, utilise la suppression listwise pour les observations avec des valeurs manquantes.
outputTablesListe les noms des tables de résultats à sauvegarder en tant que tables CAS sur le serveur.
pairWithInputSpécifie des variables numériques à corréler avec les variables définies dans le paramètre `inputs`.
pearsonOutSpécifie une table de sortie pour contenir les statistiques de corrélation de Pearson.
rankSi défini sur true, affiche les coefficients de corrélation ordonnés.
sscpSi défini sur true, génère la matrice des sommes des carrés et des produits croisés.
tableSpécifie la table CAS d'entrée pour l'analyse.
topCorrelationSpécifie le nombre de paires de corrélations les plus élevées à afficher.
varianceDivisorSpécifie le diviseur à utiliser dans le calcul de la variance (DF, N, WDF, WEIGHT).
varInfoSi défini sur true, crée une table d'informations sur les variables utilisées.
weightSpécifie une variable numérique de pondération.
Préparation des Données Voir la fiche de ce code dataprep
Création des données pour l'exemple

Ce code charge la table `CARS` de la bibliothèque `SASHELP` dans une table CAS nommée `CARS_CORR`. Nous ne conservons que quelques variables numériques pertinentes pour l'analyse de corrélation.

Copié !
1 
2DATA casuser.CARS_CORR;
3SET sashelp.cars;
4keep MPG_City MPG_Highway Weight Horsepower;
5 
6RUN;
7 

Exemples

Cet exemple calcule la matrice de corrélation de Pearson pour toutes les variables numériques de la table `CARS_CORR` et affiche les statistiques descriptives simples.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.correlation / TABLE={name='CARS_CORR'};
4 
5RUN;
6 
Résultat :
La sortie affichera les statistiques descriptives pour chaque variable, suivies de la matrice de corrélation de Pearson montrant la relation linéaire entre chaque paire de variables.

Calcule la corrélation uniquement pour les variables spécifiées dans `inputs`. L'option `covariance=true` demande la matrice de covariance, et `casOut` sauvegarde la matrice de corrélation dans une nouvelle table CAS nommée `CORR_RESULTS`.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.correlation / TABLE={name='CARS_CORR'}, inputs={{name='MPG_City'}, {name='MPG_Highway'}, {name='Weight'}}, covariance=true, casOut={name='CORR_RESULTS', replace=true};
4 
5RUN;
6 
Résultat :
Les résultats incluront les statistiques descriptives, la matrice de covariance, et la matrice de corrélation pour les variables spécifiées. Une nouvelle table CAS `CORR_RESULTS` sera créée dans la caslib active, contenant la matrice de corrélation.

Cet exemple utilise la variable `Horsepower` comme poids (`weight`) pour le calcul des corrélations. Il calcule également l'alpha de Cronbach (`alpha=true`) pour évaluer la fiabilité des variables d'entrée comme une échelle.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.correlation / TABLE={name='CARS_CORR'}, inputs={{name='MPG_City'}, {name='MPG_Highway'}, {name='Weight'}}, weight='Horsepower', alpha=true;
4 
5RUN;
6 
Résultat :
La sortie affichera les statistiques descriptives pondérées, la matrice de corrélation pondérée, et les statistiques de l'alpha de Cronbach (brut et standardisé) pour les variables d'analyse.

FAQ

À quoi sert l'action `simple.correlation` dans SAS Viya?
Quels types de statistiques peuvent être calculés avec l'action `correlation`?
Comment spécifier les variables à analyser?
Comment l'action `correlation` gère-t-elle les valeurs manquantes?
Est-il possible de pondérer les observations lors du calcul des corrélations?
Comment puis-je sauvegarder les résultats dans une table CAS?
Qu'est-ce que le paramètre `varianceDivisor` (ou `varDef`)?

Scénarios associés

Cas d'usage
Analyse de corrélation des indicateurs économiques

Une banque souhaite ajuster ses modèles de risque en analysant les corrélations historiques entre le PIB, le taux d'inflation et le taux de défaut de paiement des crédits à la c...

Cas d'usage
Analyse volumétrique capteurs vs pannes (Pondérée)

Une usine intelligente collecte des données de capteurs (Température, Vibration). On cherche à corréler ces métriques avec un indicateur binaire de panne ('FailureFlag'). Les do...

Cas d'usage
Cas limite : Données manquantes et Alpha de Cronbach

Dans un essai clinique, on évalue la cohérence interne d'un questionnaire de satisfaction patient (Q1, Q2, Q3). Le jeu de données est incomplet (patients n'ayant pas répondu à t...