decisionTree

gbtreeScore

Descripción

Esta acción puntúa una tabla utilizando un modelo de árbol de potenciación de gradiente. Proporciona acciones para el modelado y la puntuación con árboles de decisión, bosques y potenciación de gradiente.

decisionTree.gbtreeScore <result=results> <status=rc> / applyRowOrder=TRUE | FALSE, assess=TRUE | FALSE, assessOneRow=TRUE | FALSE, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars={"variable-name-1" <, "variable-name-2", ...>}, encodeName=TRUE | FALSE, includeMissing=TRUE | FALSE, modelId="string", modelTable={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, nTree=integer, offset="variable-name", rbaImp=TRUE | FALSE, seed=double, table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, target="variable-name", treeVotes=TRUE | FALSE, varIntImp=integer;
Parámetros
ParámetroDescripción
applyRowOrderEspecifica que la acción debe utilizar un orden de filas preespecificado. Esto requiere el uso de los parámetros orderby y groupby en una llamada preliminar a la acción table.partition.
assessCuando se establece en True, las probabilidades predichas se añaden a la tabla de resultados para los niveles de evento. Puede utilizar estas probabilidades predichas con la acción de evaluación.
assessOneRowCuando se establece en True, las probabilidades predichas se añaden a la tabla de resultados para los niveles de evento. Todas las probabilidades de evento se incluyen como columnas separadas y se nombran con el prefijo _DT_P_. Puede utilizar estas probabilidades predichas con la acción de evaluación.
casOutEspecifica la tabla en la que se almacenarán los resultados puntuados. Si no se especifica, la acción puntúa el conjunto de datos y calcula únicamente la tasa de clasificación errónea para las clasificaciones y el error cuadrático medio para las regresiones. Subparámetros: caslib, compress, indexVars, label, lifetime, maxMemSize, memoryFormat, name, promote, replace, replication, tableRedistUpPolicy, threadBlockSize, timeStamp, where.
copyVarsEspecifica las variables a transferir de la tabla de entrada a la tabla de salida.
encodeNameEspecifica si se deben codificar los nombres de las variables, como las probabilidades predichas de un objetivo binario o nominal en la tabla casout generada. Las probabilidades predichas se nombran con el prefijo P_ en lugar de _DT_P_.
includeMissingPor defecto, se incluyen las observaciones con valores perdidos. Cuando se establece en False, las observaciones con valores perdidos para las variables utilizadas en el modelo de árbol se ignoran al puntuar.
modelIdEspecifica el nombre de la variable de ID del modelo a utilizar al generar la tabla puntuada. Por defecto, el nombre de la variable es _DT_PredName_ para clasificaciones, _DT_PredLowerbd_ y _DT_PredUpperbd_ para un objetivo binned, y _DT_PredMean_ para regresiones.
modelTableEspecifica la tabla que contiene el modelo. Subparámetros: caslib, computedOnDemand, computedVars, computedVarsProgram, dataSourceOptions, importOptions, name (requerido), singlePass, vars, where, whereTable.
modelTable.caslibEspecifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente.
modelTable.computedOnDemandCuando se establece en True, crea las variables calculadas cuando se carga la tabla en lugar de cuando comienza la acción.
modelTable.computedVarsEspecifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. Subparámetros de computedVars: format, formattedLength, label, name (requerido), nfd, nfl.
modelTable.computedVarsProgramEspecifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
modelTable.dataSourceOptionsEspecifica las opciones de la fuente de datos.
modelTable.importOptionsEspecifica la configuración para leer una tabla desde una fuente de datos.
modelTable.nameEspecifica el nombre de la tabla de entrada.
modelTable.singlePassCuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas.
modelTable.varsEspecifica las variables a utilizar en la acción. Subparámetros de vars: format, formattedLength, label, name (requerido), nfd, nfl.
modelTable.whereEspecifica una expresión para subconjuntar los datos de entrada.
modelTable.whereTableEspecifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se utilizan todos los nombres de variable comunes a la tabla de entrada y a la tabla de filtrado para encontrar las filas coincidentes. Si se especifican el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero. Subparámetros: casLib, dataSourceOptions, importOptions, name (requerido), vars, where.
nTreeEspecifica el número de árboles a utilizar durante la puntuación.
offsetNo hay descripción disponible para este parámetro.
rbaImpEspecifica la importancia de la variable utilizando el método de asignaciones de ramas aleatorias (RBA).
seedEspecifica la semilla para el generador de números aleatorios. Por defecto, el flujo de números aleatorios se basa en el reloj del ordenador. Los valores negativos también resultan en flujos de números aleatorios basados en el reloj del ordenador. Si desea una secuencia de números aleatorios reproducible entre ejecuciones, especifique un valor mayor que cero.
tableEspecifica la configuración de una tabla de entrada. Subparámetros: caslib, computedOnDemand, computedVars, computedVarsProgram, dataSourceOptions, importOptions, name (requerido), singlePass, vars, where, whereTable.
table.caslibEspecifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente.
table.computedOnDemandCuando se establece en True, crea las variables calculadas cuando se carga la tabla en lugar de cuando comienza la acción.
table.computedVarsEspecifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. Subparámetros de computedVars: format, formattedLength, label, name (requerido), nfd, nfl.
table.computedVarsProgramEspecifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
table.dataSourceOptionsEspecifica las opciones de la fuente de datos.
table.importOptionsEspecifica la configuración para leer una tabla desde una fuente de datos.
table.nameEspecifica el nombre de la tabla de entrada.
table.singlePassCuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas.
table.varsEspecifica las variables a utilizar en la acción. Subparámetros de vars: format, formattedLength, label, name (requerido), nfd, nfl.
table.whereEspecifica una expresión para subconjuntar los datos de entrada.
table.whereTableEspecifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se utilizan todos los nombres de variable comunes a la tabla de entrada y a la tabla de filtrado para encontrar las filas coincidentes. Si se especifican el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero. Subparámetros: casLib, dataSourceOptions, importOptions, name (requerido), vars, where.
targetEspecifica la variable objetivo al puntuar un conjunto de datos. Si el nombre de la variable objetivo en el modelo de árbol es el mismo en la tabla puntuada, esta opción no es necesaria.
treeVotesSolicita que la tabla puntuada generada al puntuar el bosque se mejore con información sobre los votos de los árboles individuales.
varIntImpSolicita la importancia de la interacción de la variable y especifica el grado máximo de interacción.

Ejemplos

FAQ

¿Qué es la acción gbtreeScore?
¿Qué especifica el parámetro applyRowOrder?
¿Qué especifica el parámetro assess?
¿Qué especifica el parámetro assessOneRow?
¿Qué especifica el parámetro casOut?
¿Qué especifica el parámetro copyVars?
¿Qué especifica el parámetro encodeName?
¿Qué especifica el parámetro includeMissing?
¿Qué especifica el parámetro modelId?
¿Qué especifica el parámetro modelTable?
¿Qué especifica el parámetro nTree?
¿Qué especifica el parámetro offset?
¿Qué especifica el parámetro rbaImp?
¿Qué especifica el parámetro seed?
¿Qué especifica el parámetro table?
¿Qué especifica el parámetro target?
¿Qué especifica el parámetro treeVotes?
¿Qué especifica el parámetro varIntImp?