forestScore - WeAreCAS

Q: ¿Cuál es el propósito principal de la acción forestScore?

La acción forestScore puntúa una tabla utilizando un modelo de bosque (forest model).

Q: ¿Qué parámetros son obligatorios para ejecutar esta acción?

Se requieren los parámetros "modelTable" (que especifica la tabla que contiene el modelo) y "table" (que especifica la configuración de la tabla de entrada).

Q: ¿Cómo puedo guardar los resultados de la puntuación en una tabla de salida?

Debe utilizar el parámetro "casOut". Si no se especifica, la acción solo calcula la tasa de clasificación errónea o el error cuadrático medio sin guardar la tabla puntuada.

Q: ¿Qué funcionalidad ofrece el parámetro assess?

Cuando se establece en "True", se añaden a la tabla de resultados las probabilidades predichas para los niveles de evento.

Q: ¿Cómo se comporta la acción con los valores faltantes?

Por defecto, el parámetro "includeMissing" es "True", lo que incluye las observaciones con valores faltantes. Si se establece en "False", se ignoran dichas observaciones.

Q: ¿Qué opciones de estrategia de votación están disponibles?

El parámetro "vote" permite elegir entre "MAJORITY" (voto por mayoría para predecir) y "PROB" (probabilidad promedio del bosque para predecir).

Q: ¿Cómo se puede controlar el número de árboles utilizados para la puntuación?

Se puede utilizar el parámetro "nTree" para especificar el número entero de árboles que se usarán mientras se puntúa.

Q: ¿Qué hace el parámetro impute?

El parámetro "impute" especifica cómo manejar observaciones con un valor no faltante para la variable objetivo. Si es "True", los valores observados se asumen conocidos sin error y se usan como valores predichos.

Descripción

Puntúa una tabla utilizando un modelo de bosque (forest) previamente entrenado. Esta acción aplica el modelo a una tabla de entrada para generar predicciones, clasificaciones o estimaciones. Permite calcular errores, obtener probabilidades de eventos y evaluar la importancia de las variables e interacciones durante el proceso de puntuación.

decisionTree.forestScore <result=results> <status=rc> / applyRowOrder=TRUE | FALSE, assess=TRUE | FALSE, assessOneRow=TRUE | FALSE, casOut={ caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>} }, copyVars={"variable-name-1" <, "variable-name-2", ...>}, encodeName=TRUE | FALSE, impute=TRUE | FALSE, includeMissing=TRUE | FALSE, isolation=TRUE | FALSE, modelId="string", modelTable={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression", whereTable={ casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression" } }, nTree=integer, rbaImp=TRUE | FALSE, seed=double, table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression", whereTable={ casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression" } }, target="variable-name", treeError=TRUE | FALSE, treeVotes=TRUE | FALSE, varIntImp=integer, vote="MAJORITY" | "PROB";

Parámetros

Parámetro	Descripción
applyRowOrder	Especifica que se desea que la acción utilice un orden de filas preespecificado. Esto requiere el uso de los parámetros orderby y groupby en una llamada preliminar a la acción table.partition.
assess	Cuando se establece en True, se agregan probabilidades predichas a la tabla de resultados para los niveles de evento. Puede utilizar estas probabilidades predichas con la acción assess.
assessOneRow	Cuando se establece en True, se agregan probabilidades predichas a la tabla de resultados para los niveles de evento como columnas separadas con el prefijo _DT_P_.
casOut	Especifica la tabla donde se almacenarán los resultados puntuados. Si no se especifica, la acción puntúa el conjunto de datos y calcula solo la tasa de clasificación errónea para clasificaciones y el error cuadrático medio para regresiones.
copyVars	Especifica las variables que se transferirán de la tabla de entrada a la tabla de salida.
encodeName	Especifica si codificar los nombres de las variables, como las probabilidades predichas de un objetivo binario o nominal en la tabla casout generada. Las probabilidades predichas se nombran con el prefijo P_ en lugar de _DT_P_.
impute	Especifica cómo manejar observaciones con valor no faltante para la variable objetivo. Cuando es true, se asume que los valores observados se conocen sin error y se utilizan como valores predichos.
includeMissing	Por defecto, se incluyen las observaciones con valores faltantes. Cuando se establece en False, las observaciones con valores faltantes para las variables utilizadas en el modelo de árbol se ignoran al puntuar.
isolation	Genera puntuaciones de aislamiento para la detección de anomalías.
modelId	Especifica el nombre de la variable de ID del modelo a utilizar al generar la tabla puntuada. Por defecto, es _DT_PredName_ para clasificaciones, _DT_PredLowerbd_ y _DT_PredUpperbd_ para objetivos agrupados, y _DT_PredMean_ para regresiones.
modelTable	Especifica la tabla que contiene el modelo generado previamente.
nTree	Especifica el número de árboles a utilizar durante la puntuación. El valor predeterminado es MACINT.
rbaImp	Especifica la importancia de la variable utilizando el método de asignaciones de ramas aleatorias (RBA).
seed	Especifica la semilla para el generador de números aleatorios. El valor predeterminado es 0 (basado en el reloj del sistema).
table	Especifica la configuración para la tabla de entrada que se va a puntuar.
target	Especifica la variable objetivo al puntuar un conjunto de datos. Si el nombre de la variable objetivo en el modelo de árbol es el mismo en la tabla puntuada, esta opción no es necesaria.
treeError	Cuando se establece en True, el error se calcula para cada árbol.
treeVotes	Solicita que la tabla puntuada generada por la puntuación del bosque se mejore con información sobre los votos de los árboles individuales.
varIntImp	Solicita la importancia de la interacción de variables y especifica el grado máximo de interacción (Rango 0-3, por defecto 1).
vote	Especifica la estrategia de voto para la clasificación (MAJORITY o PROB). Influye en el código de puntuación SAS generado y en los cálculos de error OOB.

Preparación de datos Ver hoja de preparación de datos

Carga de Datos y Entrenamiento del Modelo

Carga el conjunto de datos 'cars' y entrena un modelo de bosque (forestTrain) para usarlo en la puntuación.

¡Copiado!

1
2	PROC CAS;
3	TABLE.loadTable / caslib="sashelp"
4	SOURCE="cars.sas7bdat" casOut={name="cars", replace=true};
5	decisionTree.forestTrain / TABLE={name="cars"} target="Origin" inputs={"MSRP", "Horsepower", "EngineSize"} casOut={name="forest_model", replace=true};
6
7	RUN;
8

Ejemplos

Puntúa la tabla 'cars' utilizando el modelo 'forest_model' y guarda los resultados.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1
2	PROC CAS;
3	decisionTree.forestScore / TABLE={name="cars"} modelTable={name="forest_model"} casOut={name="cars_scored", replace=true};
4
5	RUN;
6

Resultado :
Se crea la tabla 'cars_scored' con las predicciones del modelo.

Puntúa la tabla solicitando probabilidades, copiando variables identificativas y codificando nombres.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1
2	PROC CAS;
3	decisionTree.forestScore / TABLE={name="cars"} modelTable={name="forest_model"} casOut={name="cars_scored_adv", replace=true} copyVars={"Make", "Model"} vote="PROB" assess=true encodeName=true;
4
5	RUN;
6

Resultado :
La tabla de salida 'cars_scored_adv' contiene las columnas 'Make' y 'Model', y probabilidades predichas con prefijo 'P_'.

FAQ

¿Cuál es el propósito principal de la acción forestScore?

¿Qué parámetros son obligatorios para ejecutar esta acción?

¿Cómo puedo guardar los resultados de la puntuación en una tabla de salida?

¿Qué funcionalidad ofrece el parámetro assess?

¿Cómo se comporta la acción con los valores faltantes?

¿Qué opciones de estrategia de votación están disponibles?

¿Cómo se puede controlar el número de árboles utilizados para la puntuación?

¿Qué hace el parámetro impute?

Actions associées

decisionTree

forestCode

Genera código de puntuación de paso DATA (DATA step) a partir de un modelo de...

decisionTree

forestTrain

Entrena un modelo de bosque (forest). Esta acción implementa algoritmos de bo...

decisionTree

gbtreeCode

Genera código de puntuación de paso DATA (DATA step) a partir de un modelo de...

decisionTree

gbtreeScore

Esta acción puntúa una tabla utilizando un modelo de árbol de potenciación de...

decisionTree

gbtreeTrain

Entrena un árbol de impulso de gradiente. Esta acción requiere una licencia d...

Tabla de contenidos

Descripción

Carga de Datos y Entrenamiento del Modelo

Ejemplos

Puntuación Básica

Puntuación con Probabilidades y Variables Copiadas

FAQ

Actions associées

forestCode

forestTrain

gbtreeCode

gbtreeScore

gbtreeTrain