L'action `correlation` calcule les coefficients de corrélation produit-moment de Pearson, une mesure de la force et de la direction de l'association linéaire entre deux variables continues. Elle peut également calculer d'autres statistiques associées comme la covariance, la somme des carrés et des produits croisés (SSCP), et l'alpha de Cronbach.
| Paramètre | Description |
|---|---|
| alpha | Si défini sur true, calcule le coefficient alpha de Cronbach pour évaluer la cohérence interne des échelles. |
| attributes | Spécifie les attributs (comme le format ou le libellé) pour les variables de la table de sortie. |
| casOut | Spécifie la table de sortie pour stocker les résultats de la corrélation. |
| covariance | Si défini sur true, génère la matrice de variance-covariance. |
| csscp | Si défini sur true, génère la matrice des sommes corrigées des carrés et des produits croisés. |
| descriptiveStats | Si défini sur true, calcule les statistiques descriptives univariées pour les variables d'analyse. |
| display | Permet de personnaliser les tables de résultats qui sont affichées sur le client. |
| excludeNonPosWgt | Si défini sur true, exclut les observations avec une valeur de poids non positive. |
| excludePairStats | Si défini sur true, supprime l'affichage des statistiques associées à la suppression par paire des valeurs manquantes. |
| excludeProbs | Si défini sur true, supprime le calcul des probabilités (p-values) associées aux coefficients de corrélation. |
| freq | Spécifie une variable numérique de fréquence pour chaque observation. |
| groupByLimit | Spécifie le nombre maximum de niveaux à traiter pour les variables de regroupement (BY). |
| groupbyTable | Spécifie une table d'entrée contenant les groupes à utiliser pour une analyse BY. |
| inputs | Spécifie les variables numériques à inclure dans l'analyse de corrélation. |
| listwiseDelMiss | Si défini sur true, utilise la suppression listwise pour les observations avec des valeurs manquantes. |
| outputTables | Liste les noms des tables de résultats à sauvegarder en tant que tables CAS sur le serveur. |
| pairWithInput | Spécifie des variables numériques à corréler avec les variables définies dans le paramètre `inputs`. |
| pearsonOut | Spécifie une table de sortie pour contenir les statistiques de corrélation de Pearson. |
| rank | Si défini sur true, affiche les coefficients de corrélation ordonnés. |
| sscp | Si défini sur true, génère la matrice des sommes des carrés et des produits croisés. |
| table | Spécifie la table CAS d'entrée pour l'analyse. |
| topCorrelation | Spécifie le nombre de paires de corrélations les plus élevées à afficher. |
| varianceDivisor | Spécifie le diviseur à utiliser dans le calcul de la variance (DF, N, WDF, WEIGHT). |
| varInfo | Si défini sur true, crée une table d'informations sur les variables utilisées. |
| weight | Spécifie une variable numérique de pondération. |
Ce code charge la table `CARS` de la bibliothèque `SASHELP` dans une table CAS nommée `CARS_CORR`. Nous ne conservons que quelques variables numériques pertinentes pour l'analyse de corrélation.
| 1 | |
| 2 | DATA casuser.CARS_CORR; |
| 3 | SET sashelp.cars; |
| 4 | keep MPG_City MPG_Highway Weight Horsepower; |
| 5 | |
| 6 | RUN; |
| 7 |
Cet exemple calcule la matrice de corrélation de Pearson pour toutes les variables numériques de la table `CARS_CORR` et affiche les statistiques descriptives simples.
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.correlation / TABLE={name='CARS_CORR'}; |
| 4 | |
| 5 | RUN; |
| 6 |
Calcule la corrélation uniquement pour les variables spécifiées dans `inputs`. L'option `covariance=true` demande la matrice de covariance, et `casOut` sauvegarde la matrice de corrélation dans une nouvelle table CAS nommée `CORR_RESULTS`.
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.correlation / TABLE={name='CARS_CORR'}, inputs={{name='MPG_City'}, {name='MPG_Highway'}, {name='Weight'}}, covariance=true, casOut={name='CORR_RESULTS', replace=true}; |
| 4 | |
| 5 | RUN; |
| 6 |
Cet exemple utilise la variable `Horsepower` comme poids (`weight`) pour le calcul des corrélations. Il calcule également l'alpha de Cronbach (`alpha=true`) pour évaluer la fiabilité des variables d'entrée comme une échelle.
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.correlation / TABLE={name='CARS_CORR'}, inputs={{name='MPG_City'}, {name='MPG_Highway'}, {name='Weight'}}, weight='Horsepower', alpha=true; |
| 4 | |
| 5 | RUN; |
| 6 |
Une banque souhaite ajuster ses modèles de risque en analysant les corrélations historiques entre le PIB, le taux d'inflation et le taux de défaut de paiement des crédits à la c...
Une usine intelligente collecte des données de capteurs (Température, Vibration). On cherche à corréler ces métriques avec un indicateur binaire de panne ('FailureFlag'). Les do...
Dans un essai clinique, on évalue la cohérence interne d'un questionnaire de satisfaction patient (Q1, Q2, Q3). Le jeu de données est incomplet (patients n'ayant pas répondu à t...