regression

logisticScore

Descripción

Crea una tabla en el servidor que contiene los resultados de la puntuación de observaciones utilizando un modelo logístico ajustado. Esta acción permite calcular probabilidades predichas, residuos y otras estadísticas de diagnóstico para cada observación en un nuevo conjunto de datos basado en un modelo previamente entrenado.

regression.logisticScore <result=results> <status=rc> / alpha=double, casOut={...}, cBar="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, difChisq="string", difDev="string", display={...}, fitData=TRUE | FALSE, h="string", into="string", intoCutpt=double, ipred="string", lcl="string", lclm="string", level="string", obscat=TRUE | FALSE, outputTables={...}, post="string", pred="string", predprobs=TRUE | FALSE, resChi="string", resDev="string", resLik="string", resRaw="string", restore={...}, resWork="string", role="string", stdResChi="string", stdResDev="string", stdXBeta="string", table={...}, ucl="string", uclm="string", xBeta="string";
Parámetros
ParámetroDescripción
alpha Especifica el nivel de significancia para la construcción de intervalos de confianza.
casOut Especifica la tabla de salida para almacenar los resultados de la puntuación.
cBar Nombra la variable para el desplazamiento del intervalo de confianza, que mide el cambio general en las estimaciones de regresión globales que se puede atribuir a la eliminación de la observación individual.
copyVars Especifica una lista de variables para copiar de la tabla de entrada a la tabla de salida.
difChisq Nombra la variable para el cambio en el estadístico chi-cuadrado de Pearson que se puede atribuir a la eliminación de la observación individual.
difDev Nombra la variable para el cambio en la devianza que se puede atribuir a la eliminación de la observación individual.
display Especifica una lista de tablas de resultados para enviar al cliente para su visualización.
fitData Cuando se establece en True, especifica que los datos que se van a puntuar también se utilizaron para ajustar el modelo.
h Nombra la variable para el apalancamiento (leverage) de la observación.
into Nombra la variable para el nivel de respuesta predicho.
intoCutpt Especifica la probabilidad de evento predicha que determina el nivel de respuesta binario predicho.
ipred Nombra la variable para el valor predicho individual para un enlace acumulativo.
lcl Nombra la variable para el límite inferior de un intervalo de confianza para el predictor lineal.
lclm Nombra la variable para el límite inferior de un intervalo de confianza para la media.
level Nombra la variable para el nivel de respuesta ordenado.
obscat Cuando se establece en True, calcula estadísticas de salida multinomiales en el nivel de respuesta observado.
outputTables Enumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor.
post Nombra la variable para el valor predicho posterior.
pred Nombra la variable para el valor predicho (probabilidad del evento).
predprobs Cuando se establece en True, muestra las probabilidades predichas multinomiales solicitadas como variables separadas.
resChi Nombra la variable para el residuo chi-cuadrado de Pearson.
resDev Nombra la variable para el residuo de devianza.
resLik Nombra la variable para el residuo de verosimilitud (desplazamiento de verosimilitud).
resRaw Nombra la variable para el residuo bruto (observado - predicho).
restore Restaura los modelos de regresión desde un almacén de modelos (astore).
resWork Nombra la variable para el residuo de trabajo.
role Identifica los roles de entrenamiento, validación y prueba para las observaciones.
stdResChi Nombra la variable para el residuo chi-cuadrado de Pearson estandarizado.
stdResDev Nombra la variable para el residuo de devianza estandarizado.
stdXBeta Nombra la variable para el error estándar del predictor lineal.
table Especifica la tabla de datos de entrada que se va a puntuar.
ucl Nombra la variable para el límite superior de un intervalo de confianza para el predictor lineal.
uclm Nombra la variable para el límite superior de un intervalo de confianza para la media.
xBeta Nombra la variable para el predictor lineal.
Creación de datos de entrada y modelo

Este bloque de código primero crea una tabla de datos de ejemplo 'mycas.hmeq' que contiene información sobre solicitantes de préstamos. Luego, ajusta un modelo de regresión logística para predecir el incumplimiento de pago (BAD) basado en varias características del préstamo y del solicitante. Finalmente, el modelo ajustado se guarda en una tabla CAS llamada 'mycas.myModel' para ser utilizado en los ejemplos de puntuación.

¡Copiado!
1DATA mycas.hmeq; SET sampsio.hmeq; RUN;
2PROC CAS;
3regression.logistic DATA='hmeq' class={'job', 'reason'} model={depvar='bad', effects={'loan', 'mortdue', 'value', 'reason', 'job', 'yoj', 'derog', 'delinq', 'clage', 'ninq', 'clno', 'debtinc'}} store={name='myModel', replace=true};
4RUN;

Ejemplos

Este ejemplo utiliza un modelo logístico previamente ajustado y guardado en la tabla 'mycas.myModel' para puntuar el conjunto de datos 'mycas.hmeq'. Genera una nueva tabla 'mycas.hmeq_scored' que incluye las probabilidades predichas.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3regression.logisticScore restore={name='mycas.myModel'} TABLE='hmeq' casout={name='hmeq_scored', replace=true};
4RUN;
5 
Resultado :
Se crea una tabla de salida 'mycas.hmeq_scored'. Contiene las variables originales de la tabla 'hmeq' más una columna '_PRED_' con la probabilidad predicha para el nivel de evento de la variable dependiente para cada observación.

Este ejemplo demuestra cómo obtener un conjunto más rico de estadísticas de puntuación. Utiliza el modelo de la tabla 'mycas.myModel' para puntuar 'mycas.hmeq' y solicita varias estadísticas de salida: la probabilidad predicha (en una variable llamada 'PredProb'), el nivel de respuesta binario predicho ('PredClass') basado en un punto de corte de 0.5, y los límites de confianza superior e inferior para la media ('UCLM' y 'LCLM'). Todas las variables originales también se copian a la tabla de salida 'mycas.hmeq_scored_detailed'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2regression.logisticScore
3 restore={name='mycas.myModel'}
4 TABLE='hmeq'
5 fitData=true
6 casOut={name='hmeq_scored_detailed', replace=true}
7 pred='PredProb'
8 into='PredClass'
9 lclm='LCLM'
10 uclm='UCLM'
11 copyVars={'_all_'};
12RUN;
Resultado :
Se crea una tabla de salida 'mycas.hmeq_scored_detailed'. Incluye todas las variables originales de 'hmeq' junto con cuatro nuevas columnas: 'PredProb' (probabilidad predicha), 'PredClass' (0 o 1, basado en el punto de corte), 'LCLM' (límite de confianza inferior para la media) y 'UCLM' (límite de confianza superior para la media).

FAQ

¿Qué hace la acción logisticScore?
¿Cuáles son los parámetros obligatorios para la acción logisticScore?
¿Qué tipo de estadísticas de diagnóstico se pueden generar?
¿Cómo se pueden guardar las probabilidades predichas para cada nivel de la variable de respuesta?