Explore les corrélations linéaires et non linéaires entre les variables. Cette action calcule diverses statistiques de corrélation (comme Pearson, l'information mutuelle, l'incertitude symétrique) pour identifier les relations entre les variables d'entrée et potentiellement une variable cible.
| Paramètre | Description |
|---|---|
| table | Spécifie la table d'entrée, la caslib et d'autres paramètres communs de gestion des données. |
| casOut | Spécifie la table CAS de sortie où seront stockés les résultats de l'analyse de corrélation. |
| target | Spécifie la variable cible pour laquelle les corrélations avec les autres variables doivent être calculées. |
| inputs | Spécifie la liste des variables d'entrée à inclure dans l'analyse. Alias : vars. |
| nominals | Spécifie la liste des variables à traiter comme nominales. |
| stats | Spécifie les mesures de corrélation à calculer (ex: PEARSON, MI pour Information Mutuelle, SU pour Incertitude Symétrique). |
| binMissing | Si défini à Vrai, les valeurs manquantes sont incluses dans l'analyse (traitées comme un niveau distinct pour les variables nominales ou via binning). |
| distinctCountLimit | Limite pour le nombre de valeurs distinctes. Par défaut 10000 (ou 1000 sans cible). Utilisé avec l'algorithme Misra-Gries si la limite est atteinte. |
| ecdfTolerance | Tolérance pour l'approximation de la fonction de répartition cumulative empirique (utilisée par l'algorithme de quantile). |
Chargement du jeu de données 'cars' depuis la bibliothèque SASHELP vers la mémoire CAS pour l'analyse.
| 1 | |
| 2 | PROC CAS; |
| 3 | loadTable path="cars.sashdat" caslib="samples" casOut={name="cars", replace=true}; |
| 4 | |
| 5 | RUN; |
| 6 |
Analyse de base des corrélations avec une variable cible spécifiée.
| 1 | |
| 2 | PROC CAS; |
| 3 | dataSciencePilot.exploreCorrelation / TABLE={name="cars"} target="MSRP"; |
| 4 | |
| 5 | RUN; |
| 6 |
Analyse détaillant les statistiques spécifiques (Pearson, MI) et sauvegardant les résultats dans une table.
| 1 | |
| 2 | PROC CAS; |
| 3 | dataSciencePilot.exploreCorrelation / TABLE={name="cars"} target="MSRP" stats={intervalInterval={"PEARSON", "MI"}} casOut={name="corr_results", replace=true}; |
| 4 | |
| 5 | RUN; |
| 6 |