pca eig

Segmentation Clientèle via Matrice de Covariance

Scénario de test & Cas d'usage

Contexte Métier

Une enseigne de grande distribution souhaite simplifier ses variables de comportement client (Récence, Fréquence, Montant, Visites Web) pour préparer une segmentation. Les analystes veulent travailler sur la covariance brute car les unités monétaires sont significatives et ils souhaitent limiter l'analyse aux 3 axes principaux.
Préparation des Données

Génération d'une table clients avec des métriques comportementales (Revenus, Dépenses, Ancienneté).

Copié !
1 
2DATA casuser.clients;
3call streaminit(123);
4DO id = 1 to 1000;
5recence = rand('Integer', 1, 365);
6frequence = rand('Poisson', 5);
7montant = rand('Normal', 500, 100);
8visites_web = rand('Integer', 0, 50);
9OUTPUT;
10END;
11 
12RUN;
13 

Étapes de réalisation

1
Exécution de l'ACP sur matrice de covariance en limitant à 3 composantes.
Copié !
1 
2PROC CAS;
3pca.eig / TABLE={name="clients"} inputs={"recence", "frequence", "montant", "visites_web"} cov=true n=3 OUTPUT={casOut={name="client_scores", replace=true}, copyVars={"id"}} outStat={casOut={name="client_stats", replace=true}};
4 
5RUN;
6 
2
Vérification des sorties (statistiques et scores).
Copié !
1 
2PROC CAS;
3TABLE.fetch / TABLE="client_scores" to=5;
4TABLE.fetch / TABLE="client_stats";
5 
6RUN;
7 

Résultat Attendu


L'action doit produire deux tables : 'client_stats' contenant les valeurs propres basées sur la covariance, et 'client_scores' contenant les 3 nouvelles colonnes (Prin1, Prin2, Prin3) ainsi que l'identifiant client copié.