Crea una tabla en el servidor que contiene los resultados de la puntuación de las observaciones utilizando un modelo ajustado de árboles de regresión aditiva bayesianos (BART). Esta acción es fundamental para aplicar un modelo BART entrenado a nuevos datos para generar predicciones.
| Parámetro | Descripción |
|---|---|
| restore | Especifica la tabla de almacenamiento del modelo BART que se utilizará para la puntuación. Esta tabla es el resultado de una ejecución anterior de la acción `bartGauss` o `bartProbit`. |
| table | Especifica la tabla de datos de entrada que se va a puntuar. |
| casOut | Especifica la tabla de salida donde se guardarán los resultados de la puntuación. |
| alpha | Especifica el nivel de significancia para construir los límites de credibilidad. El valor predeterminado es 0.05, lo que corresponde a un intervalo de credibilidad del 95%. |
| avgOnly | Si se establece en FALSE, la tabla de salida incluirá las predicciones de cada muestra de MCMC, además de la predicción promedio. Por defecto, es TRUE, lo que solo proporciona el promedio. |
| copyVars | Especifica una lista de variables para copiar de la tabla de entrada a la tabla de salida `casOut`. |
| pred | Especifica el nombre de la variable en la tabla de salida que contendrá los valores predichos. El valor predeterminado es '_Pred'. |
| resid | Especifica el nombre de la variable en la tabla de salida que contendrá los valores residuales (diferencia entre el valor real y el predicho). |
| lcl | Especifica el nombre de la variable para el límite de credibilidad inferior de la predicción. |
| ucl | Especifica el nombre de la variable para el límite de credibilidad superior de la predicción. |
| seed | Especifica la semilla para el generador de números aleatorios, asegurando la reproducibilidad de los resultados de la puntuación si el modelo implica procesos estocásticos. |
| into | Especifica el nombre de la variable para la clasificación en modelos de respuesta binaria. |
| intoCutpt | Especifica el punto de corte para la clasificación cuando se utiliza el parámetro 'into'. |
Este bloque de código SAS crea una tabla de datos de ejemplo llamada `score_data` en la librería `mycas`. Esta tabla contiene 100 observaciones con tres variables predictoras (x1, x2, x3) y una variable de identificación (i), que se utilizará para la puntuación con un modelo BART previamente entrenado.
| 1 | DATA mycas.score_data; |
| 2 | call streaminit(123); |
| 3 | DO i = 1 to 100; |
| 4 | x1 = rand('UNIFORM'); |
| 5 | x2 = rand('UNIFORM'); |
| 6 | x3 = rand('UNIFORM'); |
| 7 | OUTPUT; |
| 8 | END; |
| 9 | RUN; |
Este ejemplo muestra cómo usar la acción `bartScore` para puntuar un nuevo conjunto de datos. Se asume que un modelo BART ya ha sido entrenado y guardado en la tabla `mycas.bart_model_store`. La acción puntúa la tabla `mycas.score_data` y guarda los resultados, incluyendo las predicciones promedio, en la tabla `mycas.bart_scored`.
| 1 | PROC CAS; |
| 2 | bart.bartScore / |
| 3 | restore={name='bart_model_store'}, |
| 4 | TABLE={name='score_data'}, |
| 5 | casOut={name='bart_scored', replace=true}; |
| 6 | RUN; |
Este ejemplo demuestra una puntuación más avanzada. Además de las predicciones, se solicitan los límites de credibilidad inferior y superior (`lcl` y `ucl`) con un nivel de significancia del 10% (`alpha=0.10`). También se solicita el cálculo de los residuos. Las variables `i` y `x1` de la tabla de entrada se copian a la tabla de salida para facilitar el análisis de los resultados.
| 1 | PROC CAS; |
| 2 | bart.bartScore / |
| 3 | restore={name='bart_model_store'}, |
| 4 | TABLE={name='score_data'}, |
| 5 | casOut={name='bart_scored_detailed', replace=true}, |
| 6 | pred='Prediccion', |
| 7 | resid='Residuo', |
| 8 | lcl='LCL_Pred', |
| 9 | ucl='UCL_Pred', |
| 10 | alpha=0.10, |
| 11 | copyVars={'i', 'x1'}; |
| 12 | RUN; |
En análisis bayesianos, es útil examinar la distribución completa de las predicciones posteriores. Al establecer `avgOnly=false`, la tabla de salida no solo contendrá la predicción promedio, sino también las predicciones individuales de cada una de las muestras de MCMC guardadas en el almacén del modelo. Esto permite un análisis más profundo de la incertidumbre del modelo.
| 1 | PROC CAS; |
| 2 | bart.bartScore / |
| 3 | restore={name='bart_model_store'}, |
| 4 | TABLE={name='score_data'}, |
| 5 | casOut={name='bart_scored_full_posterior', replace=true}, |
| 6 | avgOnly=false; |
| 7 | RUN; |
Una empresa de telecomunicaciones desea puntuar a sus clientes actuales para predecir su probabilidad de abandonar el servicio (churn). Disponen de un modelo BART entrenado con ...
Una firma de trading de energía utiliza un modelo BART para predecir los precios spot de la electricidad. Para una gestión de riesgos avanzada, no solo necesitan la predicción p...
Una fábrica puntúa piezas recién fabricadas para predecir defectos basándose en lecturas de sensores. El flujo de datos de los sensores es a veces poco fiable, resultando en val...