L'action eig (Eigenvalue Decomposition) extrait les composantes principales d'un jeu de données en utilisant la méthode de décomposition en valeurs propres. Cette méthode est utilisée pour réduire la dimensionnalité des données tout en expliquant la variabilité maximale. Elle analyse la matrice de corrélation ou de covariance des variables d'entrée. L'action prend en charge les variables numériques et permet de générer des statistiques détaillées, des scores de composantes et du code de scoring.
| Paramètre | Description |
|---|---|
| table | Spécifie la table d'entrée contenant les données à analyser. |
| inputs | Spécifie les variables numériques à utiliser pour l'analyse en composantes principales. Si omis, toutes les variables numériques sont utilisées. |
| n | Spécifie le nombre de composantes principales à calculer. La valeur 0 indique de calculer toutes les composantes possibles. |
| cov | Si défini sur Vrai (True), calcule les composantes principales à partir de la matrice de covariance au lieu de la matrice de corrélation (comportement par défaut). |
| std | Si défini sur Vrai (True), standardise les scores des composantes principales pour avoir une variance unitaire. |
| prefix | Spécifie le préfixe à utiliser pour nommer les composantes principales (par défaut 'Prin'). |
| outStat | Spécifie la table de sortie CAS qui contiendra les statistiques telles que les moyennes, écarts-types, valeurs propres et vecteurs propres. |
| output | Spécifie la table de sortie CAS qui contiendra les scores des composantes principales pour chaque observation. |
| store | Sauvegarde le modèle (informations d'ajustement) dans une table CAS pour une utilisation ultérieure (scoring). |
| code | Génère et écrit le code SAS DATA step pour calculer les valeurs prédites du modèle ajusté. |
| freq | Spécifie une variable numérique contenant la fréquence d'occurrence de chaque observation. |
| weight | Spécifie une variable numérique à utiliser comme pondération pour l'analyse. |
| partial | Spécifie les variables numériques à 'partialiser' si vous souhaitez analyser une matrice de corrélation ou de covariance partielle. |
| gpu | Contrôle l'utilisation des processeurs graphiques (GPU) pour le calcul du modèle. Utilisez le sous-paramètre 'enable=True' pour activer. |
Charge le jeu de données classique Iris dans une table CAS pour l'exemple.
| 1 | PROC CAS; |
| 2 | SESSION casauto; |
| 3 | |
| 4 | /* Chargement des données sashelp.iris en mémoire CAS */ |
| 5 | TABLE.loadTable / |
| 6 | caslib="CASUSER" |
| 7 | path="iris.sashdat" |
| 8 | casOut={name="iris", replace=true}; |
| 9 | |
| 10 | /* Alternative si le fichier n'existe pas : création depuis sashelp */ |
| 11 | DATA casuser.iris; |
| 12 | SET sashelp.iris; |
| 13 | RUN; |
| 14 | QUIT; |
Exécution de base de l'action pca.eig sur les variables numériques de la table Iris.
| 1 | PROC CAS; |
| 2 | pca.eig / |
| 3 | TABLE={name="iris"}, |
| 4 | inputs={"SepalLength", "SepalWidth", "PetalLength", "PetalWidth"}; |
| 5 | RUN; |
Exemple avancé demandant 2 composantes, sauvegardant les statistiques et les scores, et copiant la variable 'Species' dans la sortie.
| 1 | PROC CAS; |
| 2 | pca.eig / |
| 3 | TABLE={name="iris"}, |
| 4 | inputs={"SepalLength", "SepalWidth", "PetalLength", "PetalWidth"}, |
| 5 | n=2, |
| 6 | prefix="Comp", |
| 7 | outStat={name="iris_stats", replace=true}, |
| 8 | OUTPUT={ |
| 9 | casOut={name="iris_scores", replace=true}, |
| 10 | copyVars={"Species"}, |
| 11 | score="Score" |
| 12 | }; |
| 13 | RUN; |
Une enseigne de grande distribution souhaite simplifier ses variables de comportement client (Récence, Fréquence, Montant, Visites Web) pour préparer une segmentation. Les analy...
Une usine connectée génère des données depuis 50 capteurs à haute fréquence. Pour la maintenance prédictive, l'équipe d'ingénierie doit réduire ces 50 signaux en composantes lat...
Une banque développe un score de risque. Les variables (Revenu vs Ratio Dette) ont des échelles très différentes et doivent être standardisées. De plus, certaines transactions s...