logisticScore - WeAreCAS

Q: ¿Qué hace la acción logisticScore?

La acción logisticScore crea una tabla en el servidor que contiene los resultados de la puntuación de observaciones utilizando un modelo ajustado.

Q: ¿Cuáles son los parámetros obligatorios para la acción logisticScore?

Los parámetros obligatorios son 'casOut', que especifica la tabla de salida, y 'restore', que especifica el modelo de regresión a utilizar para la puntuación, restaurándolo desde un item store.

Q: ¿Qué tipo de estadísticas de diagnóstico se pueden generar?

Se pueden generar varias estadísticas de diagnóstico, como el desplazamiento del intervalo de confianza (cBar), el cambio en la ji-cuadrado de Pearson (difChisq), el cambio en la devianza (difDev), y el apalancamiento de la observación (leverage).

Q: ¿Cómo se pueden guardar las probabilidades predichas para cada nivel de la variable de respuesta?

Para guardar las probabilidades predichas, se debe usar el parámetro 'predProbs' establecido en True, lo que crea variables separadas para las probabilidades de cada nivel de respuesta en la tabla de salida.

Descripción

Crea una tabla en el servidor que contiene los resultados de la puntuación de observaciones utilizando un modelo logístico ajustado. Esta acción permite calcular probabilidades predichas, residuos y otras estadísticas de diagnóstico para cada observación en un nuevo conjunto de datos basado en un modelo previamente entrenado.

regression.logisticScore <result=results> <status=rc> / alpha=double, casOut={...}, cBar="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, difChisq="string", difDev="string", display={...}, fitData=TRUE | FALSE, h="string", into="string", intoCutpt=double, ipred="string", lcl="string", lclm="string", level="string", obscat=TRUE | FALSE, outputTables={...}, post="string", pred="string", predprobs=TRUE | FALSE, resChi="string", resDev="string", resLik="string", resRaw="string", restore={...}, resWork="string", role="string", stdResChi="string", stdResDev="string", stdXBeta="string", table={...}, ucl="string", uclm="string", xBeta="string";

Parámetros

Parámetro	Descripción
alpha	Especifica el nivel de significancia para la construcción de intervalos de confianza.
casOut	Especifica la tabla de salida para almacenar los resultados de la puntuación.
cBar	Nombra la variable para el desplazamiento del intervalo de confianza, que mide el cambio general en las estimaciones de regresión globales que se puede atribuir a la eliminación de la observación individual.
copyVars	Especifica una lista de variables para copiar de la tabla de entrada a la tabla de salida.
difChisq	Nombra la variable para el cambio en el estadístico chi-cuadrado de Pearson que se puede atribuir a la eliminación de la observación individual.
difDev	Nombra la variable para el cambio en la devianza que se puede atribuir a la eliminación de la observación individual.
display	Especifica una lista de tablas de resultados para enviar al cliente para su visualización.
fitData	Cuando se establece en True, especifica que los datos que se van a puntuar también se utilizaron para ajustar el modelo.
h	Nombra la variable para el apalancamiento (leverage) de la observación.
into	Nombra la variable para el nivel de respuesta predicho.
intoCutpt	Especifica la probabilidad de evento predicha que determina el nivel de respuesta binario predicho.
ipred	Nombra la variable para el valor predicho individual para un enlace acumulativo.
lcl	Nombra la variable para el límite inferior de un intervalo de confianza para el predictor lineal.
lclm	Nombra la variable para el límite inferior de un intervalo de confianza para la media.
level	Nombra la variable para el nivel de respuesta ordenado.
obscat	Cuando se establece en True, calcula estadísticas de salida multinomiales en el nivel de respuesta observado.
outputTables	Enumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor.
post	Nombra la variable para el valor predicho posterior.
pred	Nombra la variable para el valor predicho (probabilidad del evento).
predprobs	Cuando se establece en True, muestra las probabilidades predichas multinomiales solicitadas como variables separadas.
resChi	Nombra la variable para el residuo chi-cuadrado de Pearson.
resDev	Nombra la variable para el residuo de devianza.
resLik	Nombra la variable para el residuo de verosimilitud (desplazamiento de verosimilitud).
resRaw	Nombra la variable para el residuo bruto (observado - predicho).
restore	Restaura los modelos de regresión desde un almacén de modelos (astore).
resWork	Nombra la variable para el residuo de trabajo.
role	Identifica los roles de entrenamiento, validación y prueba para las observaciones.
stdResChi	Nombra la variable para el residuo chi-cuadrado de Pearson estandarizado.
stdResDev	Nombra la variable para el residuo de devianza estandarizado.
stdXBeta	Nombra la variable para el error estándar del predictor lineal.
table	Especifica la tabla de datos de entrada que se va a puntuar.
ucl	Nombra la variable para el límite superior de un intervalo de confianza para el predictor lineal.
uclm	Nombra la variable para el límite superior de un intervalo de confianza para la media.
xBeta	Nombra la variable para el predictor lineal.

Preparación de datos Ver hoja de preparación de datos

Creación de datos de entrada y modelo

Este bloque de código primero crea una tabla de datos de ejemplo 'mycas.hmeq' que contiene información sobre solicitantes de préstamos. Luego, ajusta un modelo de regresión logística para predecir el incumplimiento de pago (BAD) basado en varias características del préstamo y del solicitante. Finalmente, el modelo ajustado se guarda en una tabla CAS llamada 'mycas.myModel' para ser utilizado en los ejemplos de puntuación.

¡Copiado!

1	DATA mycas.hmeq; SET sampsio.hmeq; RUN;
2	PROC CAS;
3	regression.logistic DATA='hmeq' class={'job', 'reason'} model={depvar='bad', effects={'loan', 'mortdue', 'value', 'reason', 'job', 'yoj', 'derog', 'delinq', 'clage', 'ninq', 'clno', 'debtinc'}} store={name='myModel', replace=true};
4	RUN;

Ejemplos

Este ejemplo utiliza un modelo logístico previamente ajustado y guardado en la tabla 'mycas.myModel' para puntuar el conjunto de datos 'mycas.hmeq'. Genera una nueva tabla 'mycas.hmeq_scored' que incluye las probabilidades predichas.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1
2	PROC CAS;
3	regression.logisticScore restore={name='mycas.myModel'} TABLE='hmeq' casout={name='hmeq_scored', replace=true};
4	RUN;
5

Resultado :
Se crea una tabla de salida 'mycas.hmeq_scored'. Contiene las variables originales de la tabla 'hmeq' más una columna '_PRED_' con la probabilidad predicha para el nivel de evento de la variable dependiente para cada observación.

Este ejemplo demuestra cómo obtener un conjunto más rico de estadísticas de puntuación. Utiliza el modelo de la tabla 'mycas.myModel' para puntuar 'mycas.hmeq' y solicita varias estadísticas de salida: la probabilidad predicha (en una variable llamada 'PredProb'), el nivel de respuesta binario predicho ('PredClass') basado en un punto de corte de 0.5, y los límites de confianza superior e inferior para la media ('UCLM' y 'LCLM'). Todas las variables originales también se copian a la tabla de salida 'mycas.hmeq_scored_detailed'.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	regression.logisticScore
3	restore={name='mycas.myModel'}
4	TABLE='hmeq'
5	fitData=true
6	casOut={name='hmeq_scored_detailed', replace=true}
7	pred='PredProb'
8	into='PredClass'
9	lclm='LCLM'
10	uclm='UCLM'
11	copyVars={'_all_'};
12	RUN;

Resultado :
Se crea una tabla de salida 'mycas.hmeq_scored_detailed'. Incluye todas las variables originales de 'hmeq' junto con cuatro nuevas columnas: 'PredProb' (probabilidad predicha), 'PredClass' (0 o 1, basado en el punto de corte), 'LCLM' (límite de confianza inferior para la media) y 'UCLM' (límite de confianza superior para la media).

FAQ

¿Qué hace la acción logisticScore?

¿Cuáles son los parámetros obligatorios para la acción logisticScore?

¿Qué tipo de estadísticas de diagnóstico se pueden generar?

¿Cómo se pueden guardar las probabilidades predichas para cada nivel de la variable de respuesta?

Actions associées

regression

genmodScore

crea una tabla en el servidor que contiene los resultados de la puntuación de...

regression

genmod

Se ajusta a modelos de regresión lineal generalizados.

regression

glmScore

La acción `glmScore` crea una tabla en el servidor que contiene los resultado...

regression

glm

Se utiliza para ajustar modelos de regresión lineal utilizando el método de m...

regression

logisticAssociation

Calcula índices de correlación de rango entre las probabilidades predichas y ...

regression

logisticCode

Escribe código de paso DATA de SAS para calcular los valores predichos del mo...

Tabla de contenidos

Descripción

Creación de datos de entrada y modelo

Ejemplos

Puntuación simple para obtener probabilidades predichas

Puntuación detallada con múltiples estadísticas de salida

FAQ

Actions associées

genmodScore

genmod

glmScore

glm

logisticAssociation

logisticCode