bartScore - WeAreCAS

Q: ¿Cuál es el propósito de la acción bartScore en SAS Viya?

La acción `bartScore` crea una tabla en el servidor que contiene los resultados de la puntuación de observaciones utilizando un modelo ajustado de árboles de regresión aditivos bayesianos (BART).

Q: ¿Qué parámetro se utiliza para especificar la tabla de datos de entrada para la puntuación?

El parámetro `table` se utiliza para especificar la tabla de datos de entrada que se va a puntuar.

Q: ¿Cómo se especifica el modelo BART ajustado que se utilizará para la puntuación?

Se utiliza el parámetro `restore`, que es obligatorio, para especificar un objeto de tabla binaria que contiene el modelo ajustado de una ejecución anterior.

Q: ¿Qué parámetro es obligatorio para definir la tabla de salida?

El parámetro `casOut` es obligatorio y se utiliza para especificar la tabla de salida en el servidor que contendrá las estadísticas por observación calculadas.

Q: ¿Es posible incluir las predicciones de cada muestra MCMC en la salida, además del promedio?

Sí, estableciendo el parámetro `avgOnly` en `FALSE`. Por defecto, es `TRUE`, lo que significa que solo se incluyen las predicciones promedio de la muestra.

Q: ¿Cómo puedo copiar variables de la tabla de entrada a la tabla de salida?

Utilice el parámetro `copyVars` para proporcionar una lista de los nombres de las variables que desea copiar de la tabla de puntuación a la tabla de salida.

Q: ¿Qué controla el parámetro `alpha`?

El parámetro `alpha` especifica el nivel de significancia para construir los límites de credibilidad de colas iguales. Su valor predeterminado es 0.05.

Q: ¿Para qué se utiliza el parámetro `seed`?

El parámetro `seed` especifica una semilla para iniciar el generador de números pseudoaleatorios, asegurando la reproducibilidad de los resultados. El valor predeterminado es 0.

Tabla de contenidos

En resumen

Una vez consolidado el entrenamiento del algoritmo, el siguiente desafío reside en su ejecución sobre nuevas observaciones para apoyar la toma de decisiones. La acción bartScore es el componente encargado de esta tarea de inferencia, aplicando la lógica de los árboles de regresión aditivos bayesianos previamente almacenados. Esta herramienta permite a los científicos de datos obtener no solo la predicción puntual, sino también una visión profunda del comportamiento del modelo a través de intervalos de credibilidad y análisis de residuos. A continuación, presentamos una sección de dudas frecuentes diseñada para resolver cuestiones sobre la configuración de los conjuntos de datos de entrada y el manejo de las tablas de resultados.

Codes SAS Liés

Modelo Probit para Datos Binarios con PROC BART

Descripción

Crea una tabla en el servidor que contiene los resultados de la puntuación de las observaciones utilizando un modelo ajustado de árboles de regresión aditiva bayesianos (BART). Esta acción es fundamental para aplicar un modelo BART entrenado a nuevos datos para generar predicciones.

bart.bartScore / restore={caslib='string', name='table-name'} table={caslib='string', name='table-name'} casOut={caslib='string', name='table-name', replace=boolean} <alpha=double> <avgOnly=boolean> <copyVars={'variable-1', 'variable-2', ...}> <pred='string'> <resid='string'> <lcl='string'> <ucl='string'> <seed=integer>;

Parámetros

Parámetro	Descripción
restore	Especifica la tabla de almacenamiento del modelo BART que se utilizará para la puntuación. Esta tabla es el resultado de una ejecución anterior de la acción `bartGauss` o `bartProbit`.
table	Especifica la tabla de datos de entrada que se va a puntuar.
casOut	Especifica la tabla de salida donde se guardarán los resultados de la puntuación.
alpha	Especifica el nivel de significancia para construir los límites de credibilidad. El valor predeterminado es 0.05, lo que corresponde a un intervalo de credibilidad del 95%.
avgOnly	Si se establece en FALSE, la tabla de salida incluirá las predicciones de cada muestra de MCMC, además de la predicción promedio. Por defecto, es TRUE, lo que solo proporciona el promedio.
copyVars	Especifica una lista de variables para copiar de la tabla de entrada a la tabla de salida `casOut`.
pred	Especifica el nombre de la variable en la tabla de salida que contendrá los valores predichos. El valor predeterminado es '_Pred'.
resid	Especifica el nombre de la variable en la tabla de salida que contendrá los valores residuales (diferencia entre el valor real y el predicho).
lcl	Especifica el nombre de la variable para el límite de credibilidad inferior de la predicción.
ucl	Especifica el nombre de la variable para el límite de credibilidad superior de la predicción.
seed	Especifica la semilla para el generador de números aleatorios, asegurando la reproducibilidad de los resultados de la puntuación si el modelo implica procesos estocásticos.
into	Especifica el nombre de la variable para la clasificación en modelos de respuesta binaria.
intoCutpt	Especifica el punto de corte para la clasificación cuando se utiliza el parámetro 'into'.

Preparación de datos Ver hoja de preparación de datos

Creación de Datos de Puntuación

Este bloque de código SAS crea una tabla de datos de ejemplo llamada `score_data` en la librería `mycas`. Esta tabla contiene 100 observaciones con tres variables predictoras (x1, x2, x3) y una variable de identificación (i), que se utilizará para la puntuación con un modelo BART previamente entrenado.

¡Copiado!

1	DATA mycas.score_data;
2	call streaminit(123);
3	DO i = 1 to 100;
4	x1 = rand('UNIFORM');
5	x2 = rand('UNIFORM');
6	x3 = rand('UNIFORM');
7	OUTPUT;
8	END;
9	RUN;

Ejemplos

Este ejemplo muestra cómo usar la acción `bartScore` para puntuar un nuevo conjunto de datos. Se asume que un modelo BART ya ha sido entrenado y guardado en la tabla `mycas.bart_model_store`. La acción puntúa la tabla `mycas.score_data` y guarda los resultados, incluyendo las predicciones promedio, en la tabla `mycas.bart_scored`.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	bart.bartScore /
3	restore={name='bart_model_store'},
4	TABLE={name='score_data'},
5	casOut={name='bart_scored', replace=true};
6	RUN;

Resultado :
Se crea una nueva tabla CAS llamada `bart_scored` en la librería `mycas`. Esta tabla contiene las variables de `score_data` más una columna con las predicciones del modelo.

Este ejemplo demuestra una puntuación más avanzada. Además de las predicciones, se solicitan los límites de credibilidad inferior y superior (`lcl` y `ucl`) con un nivel de significancia del 10% (`alpha=0.10`). También se solicita el cálculo de los residuos. Las variables `i` y `x1` de la tabla de entrada se copian a la tabla de salida para facilitar el análisis de los resultados.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	bart.bartScore /
3	restore={name='bart_model_store'},
4	TABLE={name='score_data'},
5	casOut={name='bart_scored_detailed', replace=true},
6	pred='Prediccion',
7	resid='Residuo',
8	lcl='LCL_Pred',
9	ucl='UCL_Pred',
10	alpha=0.10,
11	copyVars={'i', 'x1'};
12	RUN;

Resultado :
Se genera la tabla `mycas.bart_scored_detailed`. Contendrá las variables `i` y `x1` de la tabla original, junto con las nuevas columnas: `Prediccion` (valor predicho), `Residuo`, `LCL_Pred` (límite de credibilidad inferior del 90%) y `UCL_Pred` (límite de credibilidad superior del 90%).

En análisis bayesianos, es útil examinar la distribución completa de las predicciones posteriores. Al establecer `avgOnly=false`, la tabla de salida no solo contendrá la predicción promedio, sino también las predicciones individuales de cada una de las muestras de MCMC guardadas en el almacén del modelo. Esto permite un análisis más profundo de la incertidumbre del modelo.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	bart.bartScore /
3	restore={name='bart_model_store'},
4	TABLE={name='score_data'},
5	casOut={name='bart_scored_full_posterior', replace=true},
6	avgOnly=false;
7	RUN;

Resultado :
La tabla de salida `mycas.bart_scored_full_posterior` contendrá múltiples filas por cada observación de entrada. Cada fila corresponderá a una predicción de una muestra de MCMC diferente, identificada por una variable como `_SampleIndex_`, además de la predicción promedio.

FAQ

¿Cuál es el propósito de la acción bartScore en SAS Viya?

¿Qué parámetro se utiliza para especificar la tabla de datos de entrada para la puntuación?

¿Cómo se especifica el modelo BART ajustado que se utilizará para la puntuación?

¿Qué parámetro es obligatorio para definir la tabla de salida?

¿Es posible incluir las predicciones de cada muestra MCMC en la salida, además del promedio?

¿Cómo puedo copiar variables de la tabla de entrada a la tabla de salida?

¿Qué controla el parámetro `alpha`?

¿Para qué se utiliza el parámetro `seed`?

Escenarios asociados

Caso de uso

Puntuación Estándar para Predicción de Abandono de Clientes

Una empresa de telecomunicaciones desea puntuar a sus clientes actuales para predecir su probabilidad de abandonar el servicio (churn). Disponen de un modelo BART entrenado con ...

Ver escenario

Caso de uso

Análisis de Incertidumbre de Precios con Muestras MCMC Completas

Una firma de trading de energía utiliza un modelo BART para predecir los precios spot de la electricidad. Para una gestión de riesgos avanzada, no solo necesitan la predicción p...

Ver escenario

Caso de uso

Gestión de Valores Faltantes en Puntuación de Calidad de Producto

Una fábrica puntúa piezas recién fabricadas para predecir defectos basándose en lecturas de sensores. El flujo de datos de los sensores es a veces poco fiable, resultando en val...

Ver escenario

Actions associées

bart

bartGauss

Ajusta modelos de árboles de regresión aditivos bayesianos (BART) a datos de ...

bart

bartProbit

Ajusta modelos de árboles de regresión aditivos bayesianos (BART) probit a da...

bart

bartScoreMargin

Calcula los márgenes predictivos utilizando un modelo de árboles de regresión...

Tabla de contenidos

En resumen

Modelo Probit para Datos Binarios con PROC BART

Descripción

Creación de Datos de Puntuación

Ejemplos

Puntuación Básica de un Modelo BART

Puntuación con Estadísticas Detalladas y Copia de Variables

Puntuación Incluyendo Todas las Muestras de MCMC

FAQ

Escenarios asociados

Caso de uso

Puntuación Estándar para Predicción de Abandono de Clientes

Caso de uso

Análisis de Incertidumbre de Precios con Muestras MCMC Completas

Caso de uso

Gestión de Valores Faltantes en Puntuación de Calidad de Producto

Actions associées

bartGauss

bartProbit

bartScoreMargin