logistic - WeAreCAS

Q: ¿Cuál es el propósito de la acción 'logistic'?

La acción 'logistic' ajusta modelos de regresión logística.

Q: ¿Cómo se especifica la variable de respuesta y los efectos del modelo?

Se utiliza el parámetro 'model', especificando la(s) variable(s) dependiente(s) en el subparámetro 'depVars' y los efectos explicativos en el subparámetro 'effects'.

Q: ¿Qué tipos de distribuciones de respuesta son compatibles?

La acción 'logistic' admite las distribuciones 'BERNOULLI', 'BINOMIAL' y 'MULTINOMIAL', que se especifican con el subparámetro 'dist' dentro del parámetro 'model'.

Q: ¿Cómo se puede realizar la selección de modelos?

La selección de modelos se puede realizar utilizando el parámetro 'selection'. Los métodos disponibles incluyen 'BACKWARD', 'ELASTICNET', 'FORWARD', 'LASSO' y 'STEPWISE'.

Q: ¿Es posible guardar el modelo ajustado para usarlo más tarde?

Sí, se puede utilizar el parámetro 'store' para guardar el modelo en una tabla CAS como un objeto binario (BLOB). Este modelo guardado se puede utilizar posteriormente con la acción 'logisticScore' para puntuar nuevos datos.

Tabla de contenidos

Codes SAS Liés

Análisis GEE de datos ordinales sobre el dolor de hombro

Prueba de homogeneidad para resultados trinomiales agregados

Ejemplo 4 para PROC NLIN: Influencia de la parametrización en la curvatura

Ejemplo 5 PROC LOGISTIC - Muestreo Estratificado

Ejemplo 3 para PROC HPLOGISTIC: Regresión Logística Ordinal

Análisis de Modelos Lineales Mixtos No Lineales (NLMIXED) para Datos Binomiales

Coerción de Parámetros

Análisis de sobredispersión en teratología

Descarga de un modelo ASTORE al sistema de archivos local

Descarga de un Store Astore al sistema de archivos local

Descripción

Ajusta modelos de regresión logística. Esta acción es fundamental para modelar resultados binarios, ordinales o nominales, permitiendo analizar la relación entre una o más variables predictoras (continuas o categóricas) y una variable de respuesta categórica. Es una de las herramientas estadísticas más utilizadas para problemas de clasificación.

regression.logistic <result=results> <status=rc> / alpha=double, applyRowOrder=TRUE | FALSE, association=TRUE | FALSE, attributes={{casinvardesc-1} <, {casinvardesc-2}, ...>}, binEps=double, class={{classStatement-1} <, {classStatement-2}, ...>}, classGlobalOpts={classopts}, classLevelsPrint=TRUE | FALSE, clb=TRUE | FALSE | "WALD" | "PL", code={aircodegen}, collection={{collection-1} <, {collection-2}, ...>}, corrB=TRUE | FALSE, covB=TRUE | FALSE, ctable={ctableOptions}, display={displayTables}, fitData=TRUE | FALSE, freq="variable-name", inputs={{casinvardesc-1} <, {casinvardesc-2}, ...>}, lackfit={lackfitOptions}, lsmeans={{lsmeansStatement-1} <, {lsmeansStatement-2}, ...>}, maxOptBatch=64-bit-integer | "AUTO", maxResponseLevels=integer, model={logisticModel}, multimember={{multimember-1} <, {multimember-2}, ...>}, multipass=TRUE | FALSE, nClassLevelsPrint=integer, noCheck=TRUE | FALSE, nominals={{casinvardesc-1} <, {casinvardesc-2}, ...>}, normalize=TRUE | FALSE, nostderr=TRUE | FALSE, noxpx=TRUE | FALSE, oddsratio={oddsratioOptions}, optimization={optimizationStatement}, output={logisticOutputStatement}, outputTables={outputTables}, parmEstLevDetails="NONE" | "RAW" | "RAW_AND_FORMATTED", partByFrac={partByFracStatement}, partByVar={partByVarStatement}, partFit=TRUE | FALSE, plConv=double, plMaxIter=integer, plSingular=double, polynomial={{polynomial-1} <, {polynomial-2}, ...>}, repeated={{logisticModelRepeated-1} <, {logisticModelRepeated-2}, ...>}, restore={castable}, seed=64-bit-integer, selection={selectionStatement}, spline={{spline-1} <, {spline-2}, ...>}, ss3=TRUE | FALSE, stb=TRUE | FALSE, store={casouttable}, storetext={"string-1" <, "string-2", ...>}, table={castable}, target="string", useLastIter=TRUE | FALSE, weight="variable-name", weightNorm=TRUE | FALSE ;

Parámetros

Parámetro	Descripción
alpha	Especifica el nivel de significancia para la construcción de todos los intervalos de confianza.
class	Nombra las variables de clasificación para ser usadas como variables explicativas en el análisis.
model	Define la variable dependiente, los efectos explicativos y las opciones del modelo.
selection	Especifica el método y las opciones para realizar la selección del modelo (por ejemplo, FORWARD, BACKWARD, STEPWISE).
output	Crea una tabla en el servidor que contiene estadísticas a nivel de observación, calculadas después de ajustar el modelo.
store	Guarda el modelo ajustado en una tabla CAS como un objeto binario (BLOB) para su uso posterior en puntuación (scoring).
table	Especifica la tabla de datos de entrada para el análisis.
freq	Nombra la variable numérica que contiene la frecuencia de ocurrencia para cada observación.
weight	Nombra la variable numérica a utilizar para realizar un análisis ponderado de los datos.
partByFrac	Especifica las fracciones de los datos a utilizar para validación y prueba, permitiendo la partición aleatoria de los datos.
partByVar	Nombra la variable y sus valores utilizados para particionar los datos en roles de entrenamiento, validación y prueba.
ctable	Crea la tabla de clasificación para evaluar el rendimiento del modelo.
oddsratio	Crea una tabla que compara subpoblaciones utilizando odds ratios.

Preparación de datos Ver hoja de preparación de datos

Creación de Datos de Ejemplo

Carga de la tabla `HMEQ` desde la librería `Sampsio` a una tabla en memoria `hmeq` en la caslib `casuser` para ser utilizada en los ejemplos. Esta tabla contiene datos sobre solicitudes de préstamos hipotecarios.

¡Copiado!

1	DATA casuser.hmeq; SET sampsio.hmeq; RUN;

Ejemplos

Este ejemplo ajusta un modelo de regresión logística básico para predecir la variable binaria `BAD` (incumplimiento de pago) utilizando `LOAN` (monto del préstamo) y `REASON` (motivo del préstamo) como variables predictoras. La variable `REASON` se trata como una variable categórica.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	regression.logistic TABLE='hmeq',
3	class={'REASON'},
4	model={depvar='BAD', effects={'REASON', 'LOAN'}}
5	;
6	RUN;

Resultado :
La salida incluye tablas con información del modelo, resumen de ajuste, convergencia y las estimaciones de los parámetros del modelo, mostrando el efecto de `REASON` y `LOAN` en la probabilidad de incumplimiento.

Este ejemplo realiza una selección de variables por pasos (stepwise) para predecir `BAD`. Incluye múltiples variables categóricas (`JOB`, `REASON`) e interacciones. El modelo final se guarda en una tabla CAS llamada `myModel` para su uso posterior en tareas de puntuación (scoring).

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	regression.logistic TABLE='hmeq',
3	class={'JOB', 'REASON'},
4	model={depvar='BAD', effects={'JOB', 'REASON', 'LOAN', 'VALUE', 'MORTDUE', 'YOJ'}},
5	selection={method='STEPWISE', slentry=0.15, slstay=0.15},
6	store={name='myModel', replace=true}
7	;
8	RUN;

Resultado :
La salida muestra el proceso de selección de variables paso a paso, incluyendo las estadísticas utilizadas para añadir o eliminar variables. Se genera una tabla `myModel` en la caslib activa que contiene el modelo final seleccionado. Las tablas de resultados incluyen `SelectionSummary` y `ParameterEstimates` para el modelo final.

Este ejemplo ajusta un modelo de regresión logística multinomial (o logística de logits generalizados) para una variable de respuesta categórica `Job`. Se calculan los odds ratios para la variable `CLAGE` para entender cómo un cambio en esta variable afecta las probabilidades relativas de las diferentes categorías de `Job`.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	regression.logistic TABLE='hmeq',
3	class={'REASON'},
4	model={depvar='Job', dist='MULTINOMIAL', link='GLOGIT', effects={'REASON', 'CLAGE', 'NINQ'}},
5	oddsratio={vars={{var='CLAGE'}}}
6	;
7	RUN;

Resultado :
La salida incluirá las estimaciones de parámetros para cada logit (comparando cada categoría de `Job` con la categoría de referencia). Además, se generará una tabla `OddsRatios` que muestra cómo cambian las probabilidades relativas para cada categoría de `Job` por cada unidad de cambio en `CLAGE`.

FAQ

¿Cuál es el propósito de la acción 'logistic'?

¿Cómo se especifica la variable de respuesta y los efectos del modelo?

¿Qué tipos de distribuciones de respuesta son compatibles?

¿Cómo se puede realizar la selección de modelos?

¿Es posible guardar el modelo ajustado para usarlo más tarde?

Actions associées

regression

genmodScore

crea una tabla en el servidor que contiene los resultados de la puntuación de...

regression

genmod

Se ajusta a modelos de regresión lineal generalizados.

regression

glmScore

La acción `glmScore` crea una tabla en el servidor que contiene los resultado...

regression

glm

Se utiliza para ajustar modelos de regresión lineal utilizando el método de m...

regression

logisticAssociation

Calcula índices de correlación de rango entre las probabilidades predichas y ...

regression

logisticCode

Escribe código de paso DATA de SAS para calcular los valores predichos del mo...

Tabla de contenidos

Análisis GEE de datos ordinales sobre el dolor de hombro

Prueba de homogeneidad para resultados trinomiales agregados

Ejemplo 4 para PROC NLIN: Influencia de la parametrización en la curvatura

Ejemplo 5 PROC LOGISTIC - Muestreo Estratificado

Ejemplo 3 para PROC HPLOGISTIC: Regresión Logística Ordinal

Análisis de Modelos Lineales Mixtos No Lineales (NLMIXED) para Datos Binomiales

Coerción de Parámetros

Análisis de sobredispersión en teratología

Descarga de un modelo ASTORE al sistema de archivos local

Descarga de un Store Astore al sistema de archivos local

Descripción

Creación de Datos de Ejemplo

Ejemplos

Ejemplo Simple: Regresión Logística Binaria

Ejemplo Detallado: Selección de Modelo Stepwise y Almacenamiento del Modelo

Ejemplo Avanzado: Modelo Multinomial y Odds Ratios

FAQ

Actions associées

genmodScore

genmod

glmScore

glm

logisticAssociation

logisticCode