Crea una tabla en el servidor que contiene los resultados de la puntuación de observaciones utilizando un modelo logístico ajustado. Esta acción permite calcular probabilidades predichas, residuos y otras estadísticas de diagnóstico para cada observación en un nuevo conjunto de datos basado en un modelo previamente entrenado.
| Parámetro | Descripción |
|---|---|
| alpha | Especifica el nivel de significancia para la construcción de intervalos de confianza. |
| casOut | Especifica la tabla de salida para almacenar los resultados de la puntuación. |
| cBar | Nombra la variable para el desplazamiento del intervalo de confianza, que mide el cambio general en las estimaciones de regresión globales que se puede atribuir a la eliminación de la observación individual. |
| copyVars | Especifica una lista de variables para copiar de la tabla de entrada a la tabla de salida. |
| difChisq | Nombra la variable para el cambio en el estadístico chi-cuadrado de Pearson que se puede atribuir a la eliminación de la observación individual. |
| difDev | Nombra la variable para el cambio en la devianza que se puede atribuir a la eliminación de la observación individual. |
| display | Especifica una lista de tablas de resultados para enviar al cliente para su visualización. |
| fitData | Cuando se establece en True, especifica que los datos que se van a puntuar también se utilizaron para ajustar el modelo. |
| h | Nombra la variable para el apalancamiento (leverage) de la observación. |
| into | Nombra la variable para el nivel de respuesta predicho. |
| intoCutpt | Especifica la probabilidad de evento predicha que determina el nivel de respuesta binario predicho. |
| ipred | Nombra la variable para el valor predicho individual para un enlace acumulativo. |
| lcl | Nombra la variable para el límite inferior de un intervalo de confianza para el predictor lineal. |
| lclm | Nombra la variable para el límite inferior de un intervalo de confianza para la media. |
| level | Nombra la variable para el nivel de respuesta ordenado. |
| obscat | Cuando se establece en True, calcula estadísticas de salida multinomiales en el nivel de respuesta observado. |
| outputTables | Enumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor. |
| post | Nombra la variable para el valor predicho posterior. |
| pred | Nombra la variable para el valor predicho (probabilidad del evento). |
| predprobs | Cuando se establece en True, muestra las probabilidades predichas multinomiales solicitadas como variables separadas. |
| resChi | Nombra la variable para el residuo chi-cuadrado de Pearson. |
| resDev | Nombra la variable para el residuo de devianza. |
| resLik | Nombra la variable para el residuo de verosimilitud (desplazamiento de verosimilitud). |
| resRaw | Nombra la variable para el residuo bruto (observado - predicho). |
| restore | Restaura los modelos de regresión desde un almacén de modelos (astore). |
| resWork | Nombra la variable para el residuo de trabajo. |
| role | Identifica los roles de entrenamiento, validación y prueba para las observaciones. |
| stdResChi | Nombra la variable para el residuo chi-cuadrado de Pearson estandarizado. |
| stdResDev | Nombra la variable para el residuo de devianza estandarizado. |
| stdXBeta | Nombra la variable para el error estándar del predictor lineal. |
| table | Especifica la tabla de datos de entrada que se va a puntuar. |
| ucl | Nombra la variable para el límite superior de un intervalo de confianza para el predictor lineal. |
| uclm | Nombra la variable para el límite superior de un intervalo de confianza para la media. |
| xBeta | Nombra la variable para el predictor lineal. |
Este bloque de código primero crea una tabla de datos de ejemplo 'mycas.hmeq' que contiene información sobre solicitantes de préstamos. Luego, ajusta un modelo de regresión logística para predecir el incumplimiento de pago (BAD) basado en varias características del préstamo y del solicitante. Finalmente, el modelo ajustado se guarda en una tabla CAS llamada 'mycas.myModel' para ser utilizado en los ejemplos de puntuación.
| 1 | DATA mycas.hmeq; SET sampsio.hmeq; RUN; |
| 2 | PROC CAS; |
| 3 | regression.logistic DATA='hmeq' class={'job', 'reason'} model={depvar='bad', effects={'loan', 'mortdue', 'value', 'reason', 'job', 'yoj', 'derog', 'delinq', 'clage', 'ninq', 'clno', 'debtinc'}} store={name='myModel', replace=true}; |
| 4 | RUN; |
Este ejemplo utiliza un modelo logístico previamente ajustado y guardado en la tabla 'mycas.myModel' para puntuar el conjunto de datos 'mycas.hmeq'. Genera una nueva tabla 'mycas.hmeq_scored' que incluye las probabilidades predichas.
| 1 | |
| 2 | PROC CAS; |
| 3 | regression.logisticScore restore={name='mycas.myModel'} TABLE='hmeq' casout={name='hmeq_scored', replace=true}; |
| 4 | RUN; |
| 5 |
Este ejemplo demuestra cómo obtener un conjunto más rico de estadísticas de puntuación. Utiliza el modelo de la tabla 'mycas.myModel' para puntuar 'mycas.hmeq' y solicita varias estadísticas de salida: la probabilidad predicha (en una variable llamada 'PredProb'), el nivel de respuesta binario predicho ('PredClass') basado en un punto de corte de 0.5, y los límites de confianza superior e inferior para la media ('UCLM' y 'LCLM'). Todas las variables originales también se copian a la tabla de salida 'mycas.hmeq_scored_detailed'.
| 1 | PROC CAS; |
| 2 | regression.logisticScore |
| 3 | restore={name='mycas.myModel'} |
| 4 | TABLE='hmeq' |
| 5 | fitData=true |
| 6 | casOut={name='hmeq_scored_detailed', replace=true} |
| 7 | pred='PredProb' |
| 8 | into='PredClass' |
| 9 | lclm='LCLM' |
| 10 | uclm='UCLM' |
| 11 | copyVars={'_all_'}; |
| 12 | RUN; |