Ajusta modelos de regresión logística. Esta acción es fundamental para modelar resultados binarios, ordinales o nominales, permitiendo analizar la relación entre una o más variables predictoras (continuas o categóricas) y una variable de respuesta categórica. Es una de las herramientas estadísticas más utilizadas para problemas de clasificación.
| Parámetro | Descripción |
|---|---|
| alpha | Especifica el nivel de significancia para la construcción de todos los intervalos de confianza. |
| class | Nombra las variables de clasificación para ser usadas como variables explicativas en el análisis. |
| model | Define la variable dependiente, los efectos explicativos y las opciones del modelo. |
| selection | Especifica el método y las opciones para realizar la selección del modelo (por ejemplo, FORWARD, BACKWARD, STEPWISE). |
| output | Crea una tabla en el servidor que contiene estadísticas a nivel de observación, calculadas después de ajustar el modelo. |
| store | Guarda el modelo ajustado en una tabla CAS como un objeto binario (BLOB) para su uso posterior en puntuación (scoring). |
| table | Especifica la tabla de datos de entrada para el análisis. |
| freq | Nombra la variable numérica que contiene la frecuencia de ocurrencia para cada observación. |
| weight | Nombra la variable numérica a utilizar para realizar un análisis ponderado de los datos. |
| partByFrac | Especifica las fracciones de los datos a utilizar para validación y prueba, permitiendo la partición aleatoria de los datos. |
| partByVar | Nombra la variable y sus valores utilizados para particionar los datos en roles de entrenamiento, validación y prueba. |
| ctable | Crea la tabla de clasificación para evaluar el rendimiento del modelo. |
| oddsratio | Crea una tabla que compara subpoblaciones utilizando odds ratios. |
Carga de la tabla `HMEQ` desde la librería `Sampsio` a una tabla en memoria `hmeq` en la caslib `casuser` para ser utilizada en los ejemplos. Esta tabla contiene datos sobre solicitudes de préstamos hipotecarios.
| 1 | DATA casuser.hmeq; SET sampsio.hmeq; RUN; |
Este ejemplo ajusta un modelo de regresión logística básico para predecir la variable binaria `BAD` (incumplimiento de pago) utilizando `LOAN` (monto del préstamo) y `REASON` (motivo del préstamo) como variables predictoras. La variable `REASON` se trata como una variable categórica.
| 1 | PROC CAS; |
| 2 | regression.logistic TABLE='hmeq', |
| 3 | class={'REASON'}, |
| 4 | model={depvar='BAD', effects={'REASON', 'LOAN'}} |
| 5 | ; |
| 6 | RUN; |
Este ejemplo realiza una selección de variables por pasos (stepwise) para predecir `BAD`. Incluye múltiples variables categóricas (`JOB`, `REASON`) e interacciones. El modelo final se guarda en una tabla CAS llamada `myModel` para su uso posterior en tareas de puntuación (scoring).
| 1 | PROC CAS; |
| 2 | regression.logistic TABLE='hmeq', |
| 3 | class={'JOB', 'REASON'}, |
| 4 | model={depvar='BAD', effects={'JOB', 'REASON', 'LOAN', 'VALUE', 'MORTDUE', 'YOJ'}}, |
| 5 | selection={method='STEPWISE', slentry=0.15, slstay=0.15}, |
| 6 | store={name='myModel', replace=true} |
| 7 | ; |
| 8 | RUN; |
Este ejemplo ajusta un modelo de regresión logística multinomial (o logística de logits generalizados) para una variable de respuesta categórica `Job`. Se calculan los odds ratios para la variable `CLAGE` para entender cómo un cambio en esta variable afecta las probabilidades relativas de las diferentes categorías de `Job`.
| 1 | PROC CAS; |
| 2 | regression.logistic TABLE='hmeq', |
| 3 | class={'REASON'}, |
| 4 | model={depvar='Job', dist='MULTINOMIAL', link='GLOGIT', effects={'REASON', 'CLAGE', 'NINQ'}}, |
| 5 | oddsratio={vars={{var='CLAGE'}}} |
| 6 | ; |
| 7 | RUN; |