phreg cox

Performance-Test mit automatischer Modellauswahl (LASSO)

Scénario de test & Cas d'usage

Geschäftskontext

Ein Telekommunikationsanbieter möchte vorhersagen, wann Kunden ihren Vertrag kündigen (Churn). Da es viele potenzielle Einflussfaktoren gibt (Nutzungsverhalten, Vertragsart, Demografie), soll die LASSO-Methode verwendet werden, um die wichtigsten Variablen automatisch auszuwählen und ein robustes Modell auf einem großen Datensatz zu erstellen.
Datenaufbereitung

Simulation eines großen Datensatzes (10.000 Kunden) mit Zufallsvariablen für die LASSO-Selektion.

Kopiert!
1 
2DATA casuser.telco_churn;
3call streaminit(123);
4DO i=1 to 10000;
5Tenure=rand('Exponential', 20);
6Churn=rand('Bernoulli', 0.3);
7MonthlyBill=rand('Normal', 50, 10);
8DataUsage=rand('Uniform', 0, 100);
9Age=rand('Integer', 18, 80);
10OUTPUT;
11END;
12 
13RUN;
14 

Étapes de réalisation

1
Durchführung der Cox-Regression mit LASSO-Selektion und Generierung des Scoring-Codes.
Kopiert!
1PROC CAS;
2 phreg.cox /
3 TABLE={name='telco_churn'}
4 selection={method='LASSO', details='ALL'}
5 model={depVar='Tenure', cnsVar='Churn', cnsValue=0, effects={'MonthlyBill', 'DataUsage', 'Age'}}
6 code={comment=TRUE};
7QUIT;

Erwartetes Ergebnis


Das System führt die Variablenselektion mittels LASSO durch. Die Ausgabe enthält den 'Selection Summary', der zeigt, welche Variablen ins Modell aufgenommen wurden, sowie den generierten SAS DATA Step Code für das Scoring neuer Daten.