decisionTree

forestScore

Descripción

Puntúa una tabla utilizando un modelo de bosque (forest) previamente entrenado. Esta acción aplica el modelo a una tabla de entrada para generar predicciones, clasificaciones o estimaciones. Permite calcular errores, obtener probabilidades de eventos y evaluar la importancia de las variables e interacciones durante el proceso de puntuación.

decisionTree.forestScore <result=results> <status=rc> / applyRowOrder=TRUE | FALSE, assess=TRUE | FALSE, assessOneRow=TRUE | FALSE, casOut={ caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>} }, copyVars={"variable-name-1" <, "variable-name-2", ...>}, encodeName=TRUE | FALSE, impute=TRUE | FALSE, includeMissing=TRUE | FALSE, isolation=TRUE | FALSE, modelId="string", modelTable={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression", whereTable={ casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression" } }, nTree=integer, rbaImp=TRUE | FALSE, seed=double, table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression", whereTable={ casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression" } }, target="variable-name", treeError=TRUE | FALSE, treeVotes=TRUE | FALSE, varIntImp=integer, vote="MAJORITY" | "PROB";
Parámetros
ParámetroDescripción
applyRowOrderEspecifica que se desea que la acción utilice un orden de filas preespecificado. Esto requiere el uso de los parámetros orderby y groupby en una llamada preliminar a la acción table.partition.
assessCuando se establece en True, se agregan probabilidades predichas a la tabla de resultados para los niveles de evento. Puede utilizar estas probabilidades predichas con la acción assess.
assessOneRowCuando se establece en True, se agregan probabilidades predichas a la tabla de resultados para los niveles de evento como columnas separadas con el prefijo _DT_P_.
casOutEspecifica la tabla donde se almacenarán los resultados puntuados. Si no se especifica, la acción puntúa el conjunto de datos y calcula solo la tasa de clasificación errónea para clasificaciones y el error cuadrático medio para regresiones.
copyVarsEspecifica las variables que se transferirán de la tabla de entrada a la tabla de salida.
encodeNameEspecifica si codificar los nombres de las variables, como las probabilidades predichas de un objetivo binario o nominal en la tabla casout generada. Las probabilidades predichas se nombran con el prefijo P_ en lugar de _DT_P_.
imputeEspecifica cómo manejar observaciones con valor no faltante para la variable objetivo. Cuando es true, se asume que los valores observados se conocen sin error y se utilizan como valores predichos.
includeMissingPor defecto, se incluyen las observaciones con valores faltantes. Cuando se establece en False, las observaciones con valores faltantes para las variables utilizadas en el modelo de árbol se ignoran al puntuar.
isolationGenera puntuaciones de aislamiento para la detección de anomalías.
modelIdEspecifica el nombre de la variable de ID del modelo a utilizar al generar la tabla puntuada. Por defecto, es _DT_PredName_ para clasificaciones, _DT_PredLowerbd_ y _DT_PredUpperbd_ para objetivos agrupados, y _DT_PredMean_ para regresiones.
modelTableEspecifica la tabla que contiene el modelo generado previamente.
nTreeEspecifica el número de árboles a utilizar durante la puntuación. El valor predeterminado es MACINT.
rbaImpEspecifica la importancia de la variable utilizando el método de asignaciones de ramas aleatorias (RBA).
seedEspecifica la semilla para el generador de números aleatorios. El valor predeterminado es 0 (basado en el reloj del sistema).
tableEspecifica la configuración para la tabla de entrada que se va a puntuar.
targetEspecifica la variable objetivo al puntuar un conjunto de datos. Si el nombre de la variable objetivo en el modelo de árbol es el mismo en la tabla puntuada, esta opción no es necesaria.
treeErrorCuando se establece en True, el error se calcula para cada árbol.
treeVotesSolicita que la tabla puntuada generada por la puntuación del bosque se mejore con información sobre los votos de los árboles individuales.
varIntImpSolicita la importancia de la interacción de variables y especifica el grado máximo de interacción (Rango 0-3, por defecto 1).
voteEspecifica la estrategia de voto para la clasificación (MAJORITY o PROB). Influye en el código de puntuación SAS generado y en los cálculos de error OOB.
Carga de Datos y Entrenamiento del Modelo

Carga el conjunto de datos 'cars' y entrena un modelo de bosque (forestTrain) para usarlo en la puntuación.

¡Copiado!
1 
2PROC CAS;
3TABLE.loadTable / caslib="sashelp"
4SOURCE="cars.sas7bdat" casOut={name="cars", replace=true};
5decisionTree.forestTrain / TABLE={name="cars"} target="Origin" inputs={"MSRP", "Horsepower", "EngineSize"} casOut={name="forest_model", replace=true};
6 
7RUN;
8 

Ejemplos

Puntúa la tabla 'cars' utilizando el modelo 'forest_model' y guarda los resultados.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3decisionTree.forestScore / TABLE={name="cars"} modelTable={name="forest_model"} casOut={name="cars_scored", replace=true};
4 
5RUN;
6 
Resultado :
Se crea la tabla 'cars_scored' con las predicciones del modelo.

Puntúa la tabla solicitando probabilidades, copiando variables identificativas y codificando nombres.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3decisionTree.forestScore / TABLE={name="cars"} modelTable={name="forest_model"} casOut={name="cars_scored_adv", replace=true} copyVars={"Make", "Model"} vote="PROB" assess=true encodeName=true;
4 
5RUN;
6 
Resultado :
La tabla de salida 'cars_scored_adv' contiene las columnas 'Make' y 'Model', y probabilidades predichas con prefijo 'P_'.

FAQ

¿Cuál es el propósito principal de la acción forestScore?
¿Qué parámetros son obligatorios para ejecutar esta acción?
¿Cómo puedo guardar los resultados de la puntuación en una tabla de salida?
¿Qué funcionalidad ofrece el parámetro assess?
¿Cómo se comporta la acción con los valores faltantes?
¿Qué opciones de estrategia de votación están disponibles?
¿Cómo se puede controlar el número de árboles utilizados para la puntuación?
¿Qué hace el parámetro impute?