Calcula índices de correlación de rango entre las probabilidades predichas y las respuestas observadas, que se utilizan para evaluar la capacidad predictiva de un modelo. Esta acción requiere como entrada una tabla que contenga los resultados de un modelo previamente ajustado, típicamente a través de la acción `logistic`.
| Parámetro | Descripción |
|---|---|
| accuracy | Incluye y nombra la precisión (accuracy) en la tabla de clasificación. |
| allStats | Cuando se establece en True, solicita todas las estadísticas disponibles. |
| association | Cuando se establece en True, crea la tabla de asociación. |
| binEps | Especifica la precisión de las probabilidades predichas que se utilizan para la clasificación. |
| casOut | Especifica la configuración para una tabla de salida. |
| ctable | Crea la tabla de clasificación. |
| cutpt | Especifica los puntos de corte para la tabla de clasificación. |
| display | Especifica una lista de tablas de resultados para enviar al cliente para su visualización. |
| fitData | Cuando se establece en True, especifica que los datos a ser puntuados también se utilizaron para ajustar el modelo. |
| fnf | Incluye y nombra la fracción de falsos negativos en la tabla de clasificación. |
| fpf | Incluye y nombra la fracción de falsos positivos (1-especificidad) en la tabla de clasificación. |
| lift | Incluye y nombra el 'lift' (elevación) en la tabla de clasificación. |
| misclass | Incluye y nombra la tasa de clasificación errónea en la tabla de clasificación. |
| nocounts | Cuando se establece en True, elimina los recuentos de la tabla de clasificación. |
| npv | Incluye y nombra el valor predictivo negativo en la tabla de clasificación. |
| outputTables | Lista los nombres de las tablas de resultados para guardar como tablas CAS en el servidor. |
| pc | Incluye y nombra el porcentaje de aciertos en la tabla de clasificación. |
| ppv | Incluye y nombra el valor predictivo positivo (precisión) en la tabla de clasificación. |
| restore | Restaura modelos de regresión desde un objeto binario grande (BLOB) almacenado en una tabla CAS, que es el resultado de una acción de modelado previa como `logistic`. |
| table | Especifica la tabla de datos de entrada que contiene la respuesta real y las probabilidades predichas del modelo a evaluar. |
| tnf | Incluye y nombra la fracción de verdaderos negativos (especificidad) en la tabla de clasificación. |
| tpf | Incluye y nombra la fracción de verdaderos positivos (recall, sensibilidad) en la tabla de clasificación. |
Este paso crea una tabla CAS llamada `mycas.score` que contiene la respuesta observada (`Bad`) y la probabilidad predicha por un modelo (`p_bad1`). La acción `logisticAssociation` utiliza esta tabla para calcular las estadísticas de asociación y clasificación. Se utiliza `store` para guardar el modelo ajustado en una tabla (`mycas.fitStore`) que se usará con el parámetro `restore`.
| 1 | PROC CAS; |
| 2 | deletion.droptable / TABLE='score', quiet=true; |
| 3 | TABLE.loadTable / path='getstarted.sashdat' caslib='samples' casOut={name='getstarted', replace=true}; |
| 4 | regression.logistic / TABLE='getstarted' class={'bad', 'job'} model={depvar='bad', effects={'job', 'delinq', 'derog'}} store={name='fitStore', replace=true} OUTPUT={casout={name='score', replace=true},pred='p_bad1',p='p_good1'}; |
| 5 | RUN; |
Este ejemplo muestra cómo usar la acción `logisticAssociation` para calcular las métricas de asociación de un modelo logístico. Se utiliza el parámetro `restore` para especificar la tabla que contiene el modelo ajustado y el parámetro `table` para especificar la tabla de puntuación con las probabilidades predichas.
| 1 | |
| 2 | PROC CAS; |
| 3 | regression.logisticAssociation / restore={name='fitStore'} TABLE='score'; |
| 4 | |
| 5 | RUN; |
| 6 |
Este ejemplo muestra cómo generar una tabla de clasificación (`ctable=TRUE`) para evaluar el rendimiento del modelo en varios umbrales de probabilidad. El parámetro `cutpt` especifica una lista de puntos de corte de 0.1 a 0.9. También se solicitan estadísticas adicionales como la precisión (`accuracy`) y el 'lift' (elevación).
| 1 | |
| 2 | PROC CAS; |
| 3 | regression.logisticAssociation / restore={name='fitStore'} TABLE='score' ctable=true cutpt={0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9} accuracy='Accuracy' lift='Lift'; |
| 4 | |
| 5 | RUN; |
| 6 |