regression

logisticScore

Descripción

Crea una tabla en el servidor que contiene los resultados de la puntuación de observaciones utilizando un modelo logístico ajustado. Esta acción permite calcular probabilidades predichas, residuos y otras estadísticas de diagnóstico para cada observación en un nuevo conjunto de datos basado en un modelo previamente entrenado.

regression.logisticScore <result=results> <status=rc> / alpha=double, casOut={...}, cBar="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, difChisq="string", difDev="string", display={...}, fitData=TRUE | FALSE, h="string", into="string", intoCutpt=double, ipred="string", lcl="string", lclm="string", level="string", obscat=TRUE | FALSE, outputTables={...}, post="string", pred="string", predprobs=TRUE | FALSE, resChi="string", resDev="string", resLik="string", resRaw="string", restore={...}, resWork="string", role="string", stdResChi="string", stdResDev="string", stdXBeta="string", table={...}, ucl="string", uclm="string", xBeta="string";
Parámetros
ParámetroDescripción
alphaEspecifica el nivel de significancia para la construcción de intervalos de confianza.
casOutEspecifica la tabla de salida para almacenar los resultados de la puntuación.
cBarNombra la variable para el desplazamiento del intervalo de confianza, que mide el cambio general en las estimaciones de regresión globales que se puede atribuir a la eliminación de la observación individual.
copyVarsEspecifica una lista de variables para copiar de la tabla de entrada a la tabla de salida.
difChisqNombra la variable para el cambio en el estadístico chi-cuadrado de Pearson que se puede atribuir a la eliminación de la observación individual.
difDevNombra la variable para el cambio en la devianza que se puede atribuir a la eliminación de la observación individual.
displayEspecifica una lista de tablas de resultados para enviar al cliente para su visualización.
fitDataCuando se establece en True, especifica que los datos que se van a puntuar también se utilizaron para ajustar el modelo.
hNombra la variable para el apalancamiento (leverage) de la observación.
intoNombra la variable para el nivel de respuesta predicho.
intoCutptEspecifica la probabilidad de evento predicha que determina el nivel de respuesta binario predicho.
ipredNombra la variable para el valor predicho individual para un enlace acumulativo.
lclNombra la variable para el límite inferior de un intervalo de confianza para el predictor lineal.
lclmNombra la variable para el límite inferior de un intervalo de confianza para la media.
levelNombra la variable para el nivel de respuesta ordenado.
obscatCuando se establece en True, calcula estadísticas de salida multinomiales en el nivel de respuesta observado.
outputTablesEnumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor.
postNombra la variable para el valor predicho posterior.
predNombra la variable para el valor predicho (probabilidad del evento).
predprobsCuando se establece en True, muestra las probabilidades predichas multinomiales solicitadas como variables separadas.
resChiNombra la variable para el residuo chi-cuadrado de Pearson.
resDevNombra la variable para el residuo de devianza.
resLikNombra la variable para el residuo de verosimilitud (desplazamiento de verosimilitud).
resRawNombra la variable para el residuo bruto (observado - predicho).
restoreRestaura los modelos de regresión desde un almacén de modelos (astore).
resWorkNombra la variable para el residuo de trabajo.
roleIdentifica los roles de entrenamiento, validación y prueba para las observaciones.
stdResChiNombra la variable para el residuo chi-cuadrado de Pearson estandarizado.
stdResDevNombra la variable para el residuo de devianza estandarizado.
stdXBetaNombra la variable para el error estándar del predictor lineal.
tableEspecifica la tabla de datos de entrada que se va a puntuar.
uclNombra la variable para el límite superior de un intervalo de confianza para el predictor lineal.
uclmNombra la variable para el límite superior de un intervalo de confianza para la media.
xBetaNombra la variable para el predictor lineal.
Creación de datos de entrada y modelo

Este bloque de código primero crea una tabla de datos de ejemplo 'mycas.hmeq' que contiene información sobre solicitantes de préstamos. Luego, ajusta un modelo de regresión logística para predecir el incumplimiento de pago (BAD) basado en varias características del préstamo y del solicitante. Finalmente, el modelo ajustado se guarda en una tabla CAS llamada 'mycas.myModel' para ser utilizado en los ejemplos de puntuación.

¡Copiado!
1DATA mycas.hmeq; SET sampsio.hmeq; RUN;
2PROC CAS;
3regression.logistic DATA='hmeq' class={'job', 'reason'} model={depvar='bad', effects={'loan', 'mortdue', 'value', 'reason', 'job', 'yoj', 'derog', 'delinq', 'clage', 'ninq', 'clno', 'debtinc'}} store={name='myModel', replace=true};
4RUN;

Ejemplos

Este ejemplo utiliza un modelo logístico previamente ajustado y guardado en la tabla 'mycas.myModel' para puntuar el conjunto de datos 'mycas.hmeq'. Genera una nueva tabla 'mycas.hmeq_scored' que incluye las probabilidades predichas.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3regression.logisticScore restore={name='mycas.myModel'} TABLE='hmeq' casout={name='hmeq_scored', replace=true};
4RUN;
5 
Resultado :
Se crea una tabla de salida 'mycas.hmeq_scored'. Contiene las variables originales de la tabla 'hmeq' más una columna '_PRED_' con la probabilidad predicha para el nivel de evento de la variable dependiente para cada observación.

Este ejemplo demuestra cómo obtener un conjunto más rico de estadísticas de puntuación. Utiliza el modelo de la tabla 'mycas.myModel' para puntuar 'mycas.hmeq' y solicita varias estadísticas de salida: la probabilidad predicha (en una variable llamada 'PredProb'), el nivel de respuesta binario predicho ('PredClass') basado en un punto de corte de 0.5, y los límites de confianza superior e inferior para la media ('UCLM' y 'LCLM'). Todas las variables originales también se copian a la tabla de salida 'mycas.hmeq_scored_detailed'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2regression.logisticScore
3 restore={name='mycas.myModel'}
4 TABLE='hmeq'
5 fitData=true
6 casOut={name='hmeq_scored_detailed', replace=true}
7 pred='PredProb'
8 into='PredClass'
9 lclm='LCLM'
10 uclm='UCLM'
11 copyVars={'_all_'};
12RUN;
Resultado :
Se crea una tabla de salida 'mycas.hmeq_scored_detailed'. Incluye todas las variables originales de 'hmeq' junto con cuatro nuevas columnas: 'PredProb' (probabilidad predicha), 'PredClass' (0 o 1, basado en el punto de corte), 'LCLM' (límite de confianza inferior para la media) y 'UCLM' (límite de confianza superior para la media).

FAQ

¿Qué hace la acción logisticScore?
¿Cuáles son los parámetros obligatorios para la acción logisticScore?
¿Qué tipo de estadísticas de diagnóstico se pueden generar?
¿Cómo se pueden guardar las probabilidades predichas para cada nivel de la variable de respuesta?