phreg cox

Prédiction de churn télécom avec sélection de variables LASSO

Scénario de test & Cas d'usage

Contexte Métier

Un opérateur de télécommunications analyse la durée de rétention de ses abonnés (Churn). Face à un grand nombre d'indicateurs comportementaux (conso data, appels, plaintes, etc.), le Data Scientist veut utiliser la régularisation LASSO pour identifier automatiquement les facteurs les plus prédictifs du désabonnement.
Préparation des Données

Simulation d'un dataset comportant de multiples variables explicatives (x1 à x20) et une variable de temps avant départ.

Copié !
1 
2DATA casuser.churn_data;
3call streaminit(456);
4array vars[20] x1-x20;
5DO i=1 to 5000;
6DO j=1 to 20;
7vars[j] = rand('NORMAL');
8END;
9churn_time = rand('WEIBULL', 1.5, 10);
10IF churn_time > 30 THEN event=0;
11ELSE event=1;
12OUTPUT;
13END;
14 
15RUN;
16 

Étapes de réalisation

1
Exécution de l'action Cox avec méthode de sélection LASSO et critère SBC.
Copié !
1 
2PROC CAS;
3phreg.cox / TABLE="churn_data" model={depVars={{name="churn_time"}}, censor="event", censVals={0}, effects={{vars={"x1", "x2", "x3", "x4", "x5", "x6", "x7", "x8", "x9", "x10", "x11", "x12"}}}} selection={method="LASSO", choose="SBC", stop="SBC"} lassoSteps=50;
4 
5RUN;
6 
7QUIT;
8 

Résultat Attendu


L'algorithme LASSO s'exécute et sélectionne un sous-ensemble optimal de variables parmi les 20 proposées, en minimisant le critère SBC. Les étapes de sélection sont affichées dans les résultats.