bart

bartScore

Descripción

Crea una tabla en el servidor que contiene los resultados de la puntuación de las observaciones utilizando un modelo ajustado de árboles de regresión aditiva bayesianos (BART). Esta acción es fundamental para aplicar un modelo BART entrenado a nuevos datos para generar predicciones.

bart.bartScore / restore={caslib='string', name='table-name'} table={caslib='string', name='table-name'} casOut={caslib='string', name='table-name', replace=boolean} <alpha=double> <avgOnly=boolean> <copyVars={'variable-1', 'variable-2', ...}> <pred='string'> <resid='string'> <lcl='string'> <ucl='string'> <seed=integer>;
Parámetros
ParámetroDescripción
restoreEspecifica la tabla de almacenamiento del modelo BART que se utilizará para la puntuación. Esta tabla es el resultado de una ejecución anterior de la acción `bartGauss` o `bartProbit`.
tableEspecifica la tabla de datos de entrada que se va a puntuar.
casOutEspecifica la tabla de salida donde se guardarán los resultados de la puntuación.
alphaEspecifica el nivel de significancia para construir los límites de credibilidad. El valor predeterminado es 0.05, lo que corresponde a un intervalo de credibilidad del 95%.
avgOnlySi se establece en FALSE, la tabla de salida incluirá las predicciones de cada muestra de MCMC, además de la predicción promedio. Por defecto, es TRUE, lo que solo proporciona el promedio.
copyVarsEspecifica una lista de variables para copiar de la tabla de entrada a la tabla de salida `casOut`.
predEspecifica el nombre de la variable en la tabla de salida que contendrá los valores predichos. El valor predeterminado es '_Pred'.
residEspecifica el nombre de la variable en la tabla de salida que contendrá los valores residuales (diferencia entre el valor real y el predicho).
lclEspecifica el nombre de la variable para el límite de credibilidad inferior de la predicción.
uclEspecifica el nombre de la variable para el límite de credibilidad superior de la predicción.
seedEspecifica la semilla para el generador de números aleatorios, asegurando la reproducibilidad de los resultados de la puntuación si el modelo implica procesos estocásticos.
intoEspecifica el nombre de la variable para la clasificación en modelos de respuesta binaria.
intoCutptEspecifica el punto de corte para la clasificación cuando se utiliza el parámetro 'into'.
Creación de Datos de Puntuación

Este bloque de código SAS crea una tabla de datos de ejemplo llamada `score_data` en la librería `mycas`. Esta tabla contiene 100 observaciones con tres variables predictoras (x1, x2, x3) y una variable de identificación (i), que se utilizará para la puntuación con un modelo BART previamente entrenado.

¡Copiado!
1DATA mycas.score_data;
2 call streaminit(123);
3 DO i = 1 to 100;
4 x1 = rand('UNIFORM');
5 x2 = rand('UNIFORM');
6 x3 = rand('UNIFORM');
7 OUTPUT;
8 END;
9RUN;

Ejemplos

Este ejemplo muestra cómo usar la acción `bartScore` para puntuar un nuevo conjunto de datos. Se asume que un modelo BART ya ha sido entrenado y guardado en la tabla `mycas.bart_model_store`. La acción puntúa la tabla `mycas.score_data` y guarda los resultados, incluyendo las predicciones promedio, en la tabla `mycas.bart_scored`.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 bart.bartScore /
3 restore={name='bart_model_store'},
4 TABLE={name='score_data'},
5 casOut={name='bart_scored', replace=true};
6RUN;
Resultado :
Se crea una nueva tabla CAS llamada `bart_scored` en la librería `mycas`. Esta tabla contiene las variables de `score_data` más una columna con las predicciones del modelo.

Este ejemplo demuestra una puntuación más avanzada. Además de las predicciones, se solicitan los límites de credibilidad inferior y superior (`lcl` y `ucl`) con un nivel de significancia del 10% (`alpha=0.10`). También se solicita el cálculo de los residuos. Las variables `i` y `x1` de la tabla de entrada se copian a la tabla de salida para facilitar el análisis de los resultados.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 bart.bartScore /
3 restore={name='bart_model_store'},
4 TABLE={name='score_data'},
5 casOut={name='bart_scored_detailed', replace=true},
6 pred='Prediccion',
7 resid='Residuo',
8 lcl='LCL_Pred',
9 ucl='UCL_Pred',
10 alpha=0.10,
11 copyVars={'i', 'x1'};
12RUN;
Resultado :
Se genera la tabla `mycas.bart_scored_detailed`. Contendrá las variables `i` y `x1` de la tabla original, junto con las nuevas columnas: `Prediccion` (valor predicho), `Residuo`, `LCL_Pred` (límite de credibilidad inferior del 90%) y `UCL_Pred` (límite de credibilidad superior del 90%).

En análisis bayesianos, es útil examinar la distribución completa de las predicciones posteriores. Al establecer `avgOnly=false`, la tabla de salida no solo contendrá la predicción promedio, sino también las predicciones individuales de cada una de las muestras de MCMC guardadas en el almacén del modelo. Esto permite un análisis más profundo de la incertidumbre del modelo.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 bart.bartScore /
3 restore={name='bart_model_store'},
4 TABLE={name='score_data'},
5 casOut={name='bart_scored_full_posterior', replace=true},
6 avgOnly=false;
7RUN;
Resultado :
La tabla de salida `mycas.bart_scored_full_posterior` contendrá múltiples filas por cada observación de entrada. Cada fila corresponderá a una predicción de una muestra de MCMC diferente, identificada por una variable como `_SampleIndex_`, además de la predicción promedio.

FAQ

¿Cuál es el propósito de la acción bartScore en SAS Viya?
¿Qué parámetro se utiliza para especificar la tabla de datos de entrada para la puntuación?
¿Cómo se especifica el modelo BART ajustado que se utilizará para la puntuación?
¿Qué parámetro es obligatorio para definir la tabla de salida?
¿Es posible incluir las predicciones de cada muestra MCMC en la salida, además del promedio?
¿Cómo puedo copiar variables de la tabla de entrada a la tabla de salida?
¿Qué controla el parámetro `alpha`?
¿Para qué se utiliza el parámetro `seed`?

Escenarios asociados

Caso de uso
Puntuación Estándar para Predicción de Abandono de Clientes

Una empresa de telecomunicaciones desea puntuar a sus clientes actuales para predecir su probabilidad de abandonar el servicio (churn). Disponen de un modelo BART entrenado con ...

Caso de uso
Análisis de Incertidumbre de Precios con Muestras MCMC Completas

Una firma de trading de energía utiliza un modelo BART para predecir los precios spot de la electricidad. Para una gestión de riesgos avanzada, no solo necesitan la predicción p...

Caso de uso
Gestión de Valores Faltantes en Puntuación de Calidad de Producto

Una fábrica puntúa piezas recién fabricadas para predecir defectos basándose en lecturas de sensores. El flujo de datos de los sensores es a veces poco fiable, resultando en val...