Scénario de test & Cas d'usage
Simulation eines großen Datensatzes (10.000 Kunden) mit Zufallsvariablen für die LASSO-Selektion.
| 1 | |
| 2 | DATA casuser.telco_churn; |
| 3 | call streaminit(123); |
| 4 | DO i=1 to 10000; |
| 5 | Tenure=rand('Exponential', 20); |
| 6 | Churn=rand('Bernoulli', 0.3); |
| 7 | MonthlyBill=rand('Normal', 50, 10); |
| 8 | DataUsage=rand('Uniform', 0, 100); |
| 9 | Age=rand('Integer', 18, 80); |
| 10 | OUTPUT; |
| 11 | END; |
| 12 | |
| 13 | RUN; |
| 14 |
| 1 | PROC CAS; |
| 2 | phreg.cox / |
| 3 | TABLE={name='telco_churn'} |
| 4 | selection={method='LASSO', details='ALL'} |
| 5 | model={depVar='Tenure', cnsVar='Churn', cnsValue=0, effects={'MonthlyBill', 'DataUsage', 'Age'}} |
| 6 | code={comment=TRUE}; |
| 7 | QUIT; |
Das System führt die Variablenselektion mittels LASSO durch. Die Ausgabe enthält den 'Selection Summary', der zeigt, welche Variablen ins Modell aufgenommen wurden, sowie den generierten SAS DATA Step Code für das Scoring neuer Daten.