Scénario de test & Cas d'usage
Aprendizaje automático automatizado (AutoML) y generación de pipelines.
Descubrir todas las acciones de dataSciencePilotCrea una tabla de préstamos ('hmeq_riesgo') a partir de 'sampsio.hmeq' e introduce valores ausentes de forma aleatoria en columnas clave como 'DEBTINC' (ratio deuda/ingresos) y 'JOB' (trabajo) para simular un conjunto de datos de solicitud de crédito real.
| 1 | DATA mycas.hmeq_riesgo; |
| 2 | SET sampsio.hmeq; |
| 3 | IF rand('UNIFORM') < 0.1 THEN call missing(DEBTINC); |
| 4 | IF rand('UNIFORM') < 0.15 THEN call missing(DELINQ); |
| 5 | IF rand('UNIFORM') < 0.2 THEN call missing(JOB); |
| 6 | IF rand('UNIFORM') < 0.05 THEN call missing(VALUE); |
| 7 | RUN; |
| 1 | PROC CAS; |
| 2 | dataSciencePilot.analyzeMissingPatterns / |
| 3 | TABLE={name='hmeq_riesgo'}, |
| 4 | target='BAD', |
| 5 | inputs={'LOAN', 'MORTDUE', 'VALUE', 'YOJ', 'DEROG', 'DELINQ', 'CLAGE', 'NINQ', 'CLNO', 'DEBTINC'}, |
| 6 | nominals={'JOB'}, |
| 7 | casOut={name='patrones_riesgo_out', replace=true}; |
| 8 | RUN; |
| 9 | QUIT; |
| 1 | PROC CAS; |
| 2 | TABLE.fetch / |
| 3 | TABLE={name='patrones_riesgo_out'}; |
| 4 | RUN; |
| 5 | QUIT; |
La tabla de salida 'patrones_riesgo_out' debe contener un resumen de los patrones de valores ausentes. Para cada patrón (ej. 'solo falta JOB', 'faltan DEBTINC y DELINQ'), la tabla debe mostrar estadísticas de la variable objetivo 'BAD', permitiendo al analista identificar si ciertos patrones de ausencia están más asociados con un mayor riesgo de incumplimiento.