Scénario de test & Cas d'usage
Simulación de una cartera de 1,000 clientes con variables de uso (minutos, datos), tipo de contrato y la variable objetivo 'CHURN' (0=No, 1=Sí).
| 1 | |
| 2 | DATA casuser.telco_churn; |
| 3 | call streaminit(123); |
| 4 | DO i=1 to 1000; |
| 5 | minutes = rand('Normal', 300, 50); |
| 6 | data_usage = rand('Uniform', 1, 10); |
| 7 | IF rand('Uniform') < 0.3 THEN contract = 'Month'; |
| 8 | ELSE contract = 'Year'; |
| 9 | IF rand('Uniform') < 0.15 + (minutes<200)*0.2 THEN churn = 1; |
| 10 | ELSE churn = 0; |
| 11 | OUTPUT; |
| 12 | END; |
| 13 | |
| 14 | RUN; |
| 15 |
| 1 | |
| 2 | PROC CAS; |
| 3 | |
| 4 | TABLE.tableInfo / TABLE='telco_churn'; |
| 5 | |
| 6 | RUN; |
| 7 |
| 1 | PROC CAS; |
| 2 | mlTools.crossValidate / |
| 3 | modelType='GRADBOOST', |
| 4 | kFolds=5, |
| 5 | seed=999, |
| 6 | trainOptions={ |
| 7 | TABLE={name='telco_churn'}, |
| 8 | target='churn', |
| 9 | inputs={'minutes', 'data_usage', 'contract'}, |
| 10 | nominals={'contract', 'churn'} |
| 11 | }; |
| 12 | RUN; QUIT; |
La acción debe ejecutarse sin errores, dividiendo los datos en 5 particiones. Se espera recibir una tabla de resumen con el error medio de clasificación (Misclassification Error) para cada uno de los 5 pliegues, demostrando la estabilidad del modelo Gradient Boosting.