regression

logisticAssociation

Descripción

Calcula índices de correlación de rango entre las probabilidades predichas y las respuestas observadas, que se utilizan para evaluar la capacidad predictiva de un modelo. Esta acción requiere como entrada una tabla que contenga los resultados de un modelo previamente ajustado, típicamente a través de la acción `logistic`.

regression.logisticAssociation / accuracy="string", allStats=TRUE | FALSE, association=TRUE | FALSE, binEps=double, casOut={...}, ctable=TRUE | FALSE, cutpt=double | {double-1, ...}, display={...}, fitData=TRUE | FALSE, fnf="string", fpf="string", lift="string", misclass="string", nocounts=TRUE | FALSE, npv="string", outputTables={...}, pc="string", ppv="string", restore={...}, table={...}, tnf="string", tpf="string";
Parámetros
ParámetroDescripción
accuracyIncluye y nombra la precisión (accuracy) en la tabla de clasificación.
allStatsCuando se establece en True, solicita todas las estadísticas disponibles.
associationCuando se establece en True, crea la tabla de asociación.
binEpsEspecifica la precisión de las probabilidades predichas que se utilizan para la clasificación.
casOutEspecifica la configuración para una tabla de salida.
ctableCrea la tabla de clasificación.
cutptEspecifica los puntos de corte para la tabla de clasificación.
displayEspecifica una lista de tablas de resultados para enviar al cliente para su visualización.
fitDataCuando se establece en True, especifica que los datos a ser puntuados también se utilizaron para ajustar el modelo.
fnfIncluye y nombra la fracción de falsos negativos en la tabla de clasificación.
fpfIncluye y nombra la fracción de falsos positivos (1-especificidad) en la tabla de clasificación.
liftIncluye y nombra el 'lift' (elevación) en la tabla de clasificación.
misclassIncluye y nombra la tasa de clasificación errónea en la tabla de clasificación.
nocountsCuando se establece en True, elimina los recuentos de la tabla de clasificación.
npvIncluye y nombra el valor predictivo negativo en la tabla de clasificación.
outputTablesLista los nombres de las tablas de resultados para guardar como tablas CAS en el servidor.
pcIncluye y nombra el porcentaje de aciertos en la tabla de clasificación.
ppvIncluye y nombra el valor predictivo positivo (precisión) en la tabla de clasificación.
restoreRestaura modelos de regresión desde un objeto binario grande (BLOB) almacenado en una tabla CAS, que es el resultado de una acción de modelado previa como `logistic`.
tableEspecifica la tabla de datos de entrada que contiene la respuesta real y las probabilidades predichas del modelo a evaluar.
tnfIncluye y nombra la fracción de verdaderos negativos (especificidad) en la tabla de clasificación.
tpfIncluye y nombra la fracción de verdaderos positivos (recall, sensibilidad) en la tabla de clasificación.
Creación de la Tabla de Puntuación

Este paso crea una tabla CAS llamada `mycas.score` que contiene la respuesta observada (`Bad`) y la probabilidad predicha por un modelo (`p_bad1`). La acción `logisticAssociation` utiliza esta tabla para calcular las estadísticas de asociación y clasificación. Se utiliza `store` para guardar el modelo ajustado en una tabla (`mycas.fitStore`) que se usará con el parámetro `restore`.

¡Copiado!
1PROC CAS;
2deletion.droptable / TABLE='score', quiet=true;
3 TABLE.loadTable / path='getstarted.sashdat' caslib='samples' casOut={name='getstarted', replace=true};
4 regression.logistic / TABLE='getstarted' class={'bad', 'job'} model={depvar='bad', effects={'job', 'delinq', 'derog'}} store={name='fitStore', replace=true} OUTPUT={casout={name='score', replace=true},pred='p_bad1',p='p_good1'};
5 RUN;

Ejemplos

Este ejemplo muestra cómo usar la acción `logisticAssociation` para calcular las métricas de asociación de un modelo logístico. Se utiliza el parámetro `restore` para especificar la tabla que contiene el modelo ajustado y el parámetro `table` para especificar la tabla de puntuación con las probabilidades predichas.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3regression.logisticAssociation / restore={name='fitStore'} TABLE='score';
4 
5RUN;
6 
Resultado :
La acción genera la tabla 'Association Statistics' que contiene métricas como el D de Somers, Gamma, Tau-a y c (AUC). Estos índices miden la capacidad del modelo para discriminar entre eventos y no eventos.

Este ejemplo muestra cómo generar una tabla de clasificación (`ctable=TRUE`) para evaluar el rendimiento del modelo en varios umbrales de probabilidad. El parámetro `cutpt` especifica una lista de puntos de corte de 0.1 a 0.9. También se solicitan estadísticas adicionales como la precisión (`accuracy`) y el 'lift' (elevación).

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3regression.logisticAssociation / restore={name='fitStore'} TABLE='score' ctable=true cutpt={0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9} accuracy='Accuracy' lift='Lift';
4 
5RUN;
6 
Resultado :
La salida incluye dos tablas: 'Association Statistics' y 'Classification'. La tabla 'Classification' muestra para cada punto de corte el número de verdaderos/falsos positivos/negativos, así como las métricas de Precisión y Lift solicitadas, permitiendo un análisis detallado del rendimiento del modelo en diferentes umbrales.

FAQ

¿Qué hace la acción logisticAssociation?
¿Cuál es el propósito del parámetro 'accuracy'?
¿Qué sucede cuando el parámetro 'allStats' se establece en True?
¿Cuál es la función del parámetro 'association'?
¿Qué especifica el parámetro 'binEps'?
¿Para qué se utiliza el parámetro 'casOut'?
¿Qué hace el parámetro 'ctable'?
¿Cómo funciona el parámetro 'cutpt'?
¿Qué indica el parámetro 'fitData'?
¿Qué representa el parámetro 'fnf'?
¿Cuál es el uso del parámetro 'restore'?
¿Qué especifica el parámetro 'table'?