decisionTree

gbtreeScore

Descripción

Esta acción puntúa una tabla utilizando un modelo de árbol de potenciación de gradiente. Proporciona acciones para el modelado y la puntuación con árboles de decisión, bosques y potenciación de gradiente.

decisionTree.gbtreeScore <result=results> <status=rc> / applyRowOrder=TRUE | FALSE, assess=TRUE | FALSE, assessOneRow=TRUE | FALSE, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars={"variable-name-1" <, "variable-name-2", ...>}, encodeName=TRUE | FALSE, includeMissing=TRUE | FALSE, modelId="string", modelTable={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, nTree=integer, offset="variable-name", rbaImp=TRUE | FALSE, seed=double, table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, target="variable-name", treeVotes=TRUE | FALSE, varIntImp=integer;
Parámetros
ParámetroDescripción
applyRowOrder Especifica que la acción debe utilizar un orden de filas preespecificado. Esto requiere el uso de los parámetros orderby y groupby en una llamada preliminar a la acción table.partition.
assess Cuando se establece en True, las probabilidades predichas se añaden a la tabla de resultados para los niveles de evento. Puede utilizar estas probabilidades predichas con la acción de evaluación.
assessOneRow Cuando se establece en True, las probabilidades predichas se añaden a la tabla de resultados para los niveles de evento. Todas las probabilidades de evento se incluyen como columnas separadas y se nombran con el prefijo _DT_P_. Puede utilizar estas probabilidades predichas con la acción de evaluación.
casOut Especifica la tabla en la que se almacenarán los resultados puntuados. Si no se especifica, la acción puntúa el conjunto de datos y calcula únicamente la tasa de clasificación errónea para las clasificaciones y el error cuadrático medio para las regresiones. Subparámetros: caslib, compress, indexVars, label, lifetime, maxMemSize, memoryFormat, name, promote, replace, replication, tableRedistUpPolicy, threadBlockSize, timeStamp, where.
copyVars Especifica las variables a transferir de la tabla de entrada a la tabla de salida.
encodeName Especifica si se deben codificar los nombres de las variables, como las probabilidades predichas de un objetivo binario o nominal en la tabla casout generada. Las probabilidades predichas se nombran con el prefijo P_ en lugar de _DT_P_.
includeMissing Por defecto, se incluyen las observaciones con valores perdidos. Cuando se establece en False, las observaciones con valores perdidos para las variables utilizadas en el modelo de árbol se ignoran al puntuar.
modelId Especifica el nombre de la variable de ID del modelo a utilizar al generar la tabla puntuada. Por defecto, el nombre de la variable es _DT_PredName_ para clasificaciones, _DT_PredLowerbd_ y _DT_PredUpperbd_ para un objetivo binned, y _DT_PredMean_ para regresiones.
modelTable Especifica la tabla que contiene el modelo. Subparámetros: caslib, computedOnDemand, computedVars, computedVarsProgram, dataSourceOptions, importOptions, name (requerido), singlePass, vars, where, whereTable.
modelTable.caslib Especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente.
modelTable.computedOnDemand Cuando se establece en True, crea las variables calculadas cuando se carga la tabla en lugar de cuando comienza la acción.
modelTable.computedVars Especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. Subparámetros de computedVars: format, formattedLength, label, name (requerido), nfd, nfl.
modelTable.computedVarsProgram Especifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
modelTable.dataSourceOptions Especifica las opciones de la fuente de datos.
modelTable.importOptions Especifica la configuración para leer una tabla desde una fuente de datos.
modelTable.name Especifica el nombre de la tabla de entrada.
modelTable.singlePass Cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas.
modelTable.vars Especifica las variables a utilizar en la acción. Subparámetros de vars: format, formattedLength, label, name (requerido), nfd, nfl.
modelTable.where Especifica una expresión para subconjuntar los datos de entrada.
modelTable.whereTable Especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se utilizan todos los nombres de variable comunes a la tabla de entrada y a la tabla de filtrado para encontrar las filas coincidentes. Si se especifican el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero. Subparámetros: casLib, dataSourceOptions, importOptions, name (requerido), vars, where.
nTree Especifica el número de árboles a utilizar durante la puntuación.
offset No hay descripción disponible para este parámetro.
rbaImp Especifica la importancia de la variable utilizando el método de asignaciones de ramas aleatorias (RBA).
seed Especifica la semilla para el generador de números aleatorios. Por defecto, el flujo de números aleatorios se basa en el reloj del ordenador. Los valores negativos también resultan en flujos de números aleatorios basados en el reloj del ordenador. Si desea una secuencia de números aleatorios reproducible entre ejecuciones, especifique un valor mayor que cero.
table Especifica la configuración de una tabla de entrada. Subparámetros: caslib, computedOnDemand, computedVars, computedVarsProgram, dataSourceOptions, importOptions, name (requerido), singlePass, vars, where, whereTable.
table.caslib Especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente.
table.computedOnDemand Cuando se establece en True, crea las variables calculadas cuando se carga la tabla en lugar de cuando comienza la acción.
table.computedVars Especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. Subparámetros de computedVars: format, formattedLength, label, name (requerido), nfd, nfl.
table.computedVarsProgram Especifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
table.dataSourceOptions Especifica las opciones de la fuente de datos.
table.importOptions Especifica la configuración para leer una tabla desde una fuente de datos.
table.name Especifica el nombre de la tabla de entrada.
table.singlePass Cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas.
table.vars Especifica las variables a utilizar en la acción. Subparámetros de vars: format, formattedLength, label, name (requerido), nfd, nfl.
table.where Especifica una expresión para subconjuntar los datos de entrada.
table.whereTable Especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se utilizan todos los nombres de variable comunes a la tabla de entrada y a la tabla de filtrado para encontrar las filas coincidentes. Si se especifican el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero. Subparámetros: casLib, dataSourceOptions, importOptions, name (requerido), vars, where.
target Especifica la variable objetivo al puntuar un conjunto de datos. Si el nombre de la variable objetivo en el modelo de árbol es el mismo en la tabla puntuada, esta opción no es necesaria.
treeVotes Solicita que la tabla puntuada generada al puntuar el bosque se mejore con información sobre los votos de los árboles individuales.
varIntImp Solicita la importancia de la interacción de la variable y especifica el grado máximo de interacción.

Ejemplos

FAQ

¿Qué es la acción gbtreeScore?
¿Qué especifica el parámetro applyRowOrder?
¿Qué especifica el parámetro assess?
¿Qué especifica el parámetro assessOneRow?
¿Qué especifica el parámetro casOut?
¿Qué especifica el parámetro copyVars?
¿Qué especifica el parámetro encodeName?
¿Qué especifica el parámetro includeMissing?
¿Qué especifica el parámetro modelId?
¿Qué especifica el parámetro modelTable?
¿Qué especifica el parámetro nTree?
¿Qué especifica el parámetro offset?
¿Qué especifica el parámetro rbaImp?
¿Qué especifica el parámetro seed?
¿Qué especifica el parámetro table?
¿Qué especifica el parámetro target?
¿Qué especifica el parámetro treeVotes?
¿Qué especifica el parámetro varIntImp?