gbtreeTrain - WeAreCAS

Q: ¿Especifica si la acción debe usar un orden de fila predefinido?

Esto requiere el uso de los parámetros 'orderby' y 'groupby' en una llamada preliminar a la acción 'table.partition'.

Q: ¿Especifica atributos temporales a aplicar a las variables de entrada?

Por ejemplo, un formato. Para obtener más información sobre cómo especificar el parámetro 'attributes', consulte el parámetro 'casinvardesc' común.

Q: ¿Se conserva el orden de los bins para las variables numéricas?

De forma predeterminada, el orden de los bins se conserva para las variables numéricas. Cuando se establece en 'False', el orden de los bins se ignora para las variables numéricas.

Q: ¿Especifica la tabla donde se almacenará el modelo de árbol de decisión?

Cuando no se especifica, se genera un nombre aleatorio. Para obtener más información sobre cómo especificar el parámetro 'casOut', consulte el parámetro 'casouttable' común.

Q: ¿Especifica la configuración para una tabla de salida?

Para obtener más información sobre cómo especificar el parámetro 'casOut', consulte el parámetro 'casouttable' común.

Q: ¿Agrega comentarios al código del paso DATA?

Cuando se establece en 'True', agrega comentarios al código del paso DATA. Por defecto es 'False'.

Q: ¿Especifica el ancho a usar para formatear números derivados en el código del paso DATA?

Por ejemplo, las estimaciones de parámetros. Alias: 'fmtWidth'. Valor por defecto: '20'. Rango: '0–32'.

Tabla de contenidos

Codes SAS Liés

Entrenamiento de un modelo Gradient Boosting para la predicción de salario

Descripción

Entrena un árbol de impulso de gradiente. Esta acción requiere una licencia de SAS Visual Data Mining and Machine Learning.

decisionTree.gbtreeTrain <result=results> <status=rc> / applyRowOrder=TRUE | FALSE, attributes={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, auxData="variable-name", binOrder=TRUE | FALSE, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, code={casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, comment=TRUE | FALSE, fmtWdth=integer, indentSize=integer, labelId=integer, lineSize=integer, noTrim=TRUE | FALSE, tabForm=TRUE | FALSE}, codeInteractions={casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, comment=TRUE | FALSE, fmtWdth=integer, indentSize=integer, labelId=integer, lineSize=integer, noTrim=TRUE | FALSE, tabForm=TRUE | FALSE}, distribution="BINARY" | "GAUSSIAN" | "MULTINOMIAL" | "POISSON" | "TWEEDIE" | 64-bit-integer, earlyStop={metric="ASE" | "LOGLOSS" | "MCR", minimum=TRUE | FALSE, stagnation=64-bit-integer, threshold=double, thresholdIter=64-bit-integer, tolerance=double}, encodeName=TRUE | FALSE, fcmpEvalMetric="string", freq="variable-name", greedy=TRUE | FALSE, includeMissing=TRUE | FALSE, initPred=double, inputs={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, lasso=double, leafSize=integer, learningRate=double, logLevel=integer, m=integer, maxBranch=integer, maxLevel=integer, mergeBin=TRUE | FALSE, minHessian=double, minUseInSearch=integer, missing="MACSMALL" | "USEINSEARCH", modelId="string", modelTable={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, monoDec={"string-1" <, "string-2", ...>}, monoInc={"string-1" <, "string-2", ...>}, nBins=integer, nominalHandling="CLASSIC" | "ENHANCED", nominals={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, nominalSearch={handling="CLASSIC" | "ENHANCED", maxCategories=64-bit-integer, shrinkage=double, sort=64-bit-integer, sortBy="COUNT" | "TARGET"}, nTree=integer, offset="variable-name", phi=double, power=double, quantileBin=TRUE | FALSE, ridge=double, saveState={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, seed=double, singular=double, subSampleRate=double, table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, target="variable-name", transLearnBurn=integer, transLearnShrink=double, transLearnTrim=double, validTable={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, varImp=TRUE | FALSE, varIntImp=integer, weight="variable-name" ;

Parámetros

Parámetro	Descripción
applyRowOrder	Especifica que desea que la acción utilice un orden de filas preestablecido. Esto requiere el uso de los parámetros orderby y groupby en una llamada de acción table.partition preliminar.
attributes	Especifica atributos temporales, como un formato, para aplicar a las variables de entrada. Para obtener más información, consulte el parámetro casinvardesc común.
auxData	Especifica una variable para el aprendizaje por transferencia que indica qué observaciones provienen de una fuente auxiliar. Un valor de 0 indica una observación de entrenamiento tradicional. Otros valores indican datos auxiliares.
binOrder	Por defecto, el orden de los bins se conserva para las variables numéricas. Cuando se establece en False, el orden de los bins se ignora para las variables numéricas.
casOut	Especifica la tabla donde se almacenará el modelo de árbol de decisión. Si no se especifica, se genera un nombre aleatorio. Para obtener más información, consulte el parámetro casouttable común.
code	Solicita que la acción produzca código de puntuación SAS. Especifique parámetros adicionales. Para obtener más información, consulte el parámetro codegen común.
codeInteractions	Solicita que la acción produzca código de puntuación SAS para crear variables que codifiquen interacciones. También debe solicitar interacciones de variables de al menos grado 2.
distribution	Especifica la distribución en el árbol de impulso de gradiente. BINARY es útil para la clasificación binaria. GAUSSIAN es útil para árboles de regresión. MULTINOMIAL es útil para la distribución multinomial para la clasificación con más de dos clases. POISSON es útil para la distribución de Poisson. TWEEDIE es útil para la distribución de Tweedie.
earlyStop	El valor de tkcasdt_earlyStop puede ser uno o más de los siguientes:
earlyStop.metric
earlyStop.minimum
earlyStop.stagnation
earlyStop.threshold
earlyStop.thresholdIter
earlyStop.tolerance
encodeName	Especifica si se deben codificar los nombres de las variables, como las probabilidades predichas de un objetivo binario o nominal en la tabla casout generada. Las probabilidades predichas se nombran con el prefijo P_ en lugar de _DT_P_.
fcmpEvalMetric	Especifica la métrica de evaluación FCMP para los modelos de árbol de impulso de gradiente.
freq	Especifica una variable numérica que contiene la frecuencia de aparición de cada observación.
greedy	Por defecto, se utiliza una búsqueda codiciosa o exhaustiva para determinar la mejor división para cada variable de cada nodo de árbol. Cuando se establece en False, se aplica un algoritmo rápido y eficiente basado en la agrupación. Se recomienda establecer este parámetro en False para variables con alta cardinalidad.
includeMissing	Por defecto, se incluyen las observaciones con valores perdidos. Cuando se establece en False, las observaciones con valores perdidos para las variables utilizadas en el modelo de árbol se ignoran al puntuar.
initPred
inputs	Especifica las variables de entrada a utilizar en el análisis. Para obtener más información, consulte el parámetro casinvardesc común.
lasso	Especifica la regularización de la norma L1 en la predicción. El valor debe ser mayor o igual a cero.
leafSize	Especifica el número mínimo de observaciones en cada nodo.
learningRate	Especifica la tasa de aprendizaje de cada árbol.
logLevel
m	Especifica el número de variables de entrada a considerar para la división en un nodo. Las variables se seleccionan al azar de las variables de entrada para cada árbol. Por defecto, el bosque utiliza la raíz cuadrada del número de variables de entrada, redondeada al entero más cercano. Para el impulso de gradiente, se utiliza el número de variables de entrada.
maxBranch	Especifica el número máximo de hijos (ramas) permitidos para cada nivel del árbol.
maxLevel	Especifica el número máximo de nivel del árbol.
mergeBin	Por defecto, cuando el valor más grande en un bin coincide con el valor más bajo en un bin vecino, los valores se fusionan en el bin inferior. Cuando se establece en False, la acción no intenta fusionar los bins.
minHessian
minUseInSearch	Especifica un umbral para utilizar valores perdidos en la búsqueda de división cuando el parámetro missing se establece en USEINSEARCH. Si el número de observaciones en las que la variable de división tiene valores perdidos en un nodo es mayor o igual al valor especificado, la acción inicia la política USEINSEARCH. De lo contrario, los valores perdidos se asignan a una rama popular.
missing	Especifica la política de valores perdidos para manejar valores perdidos.
missing.MACSMALL	Especifica que los valores perdidos para las variables numéricas se traten como el valor de máquina más pequeño y que los valores perdidos para las variables nominales se traten como un nivel separado.
missing.USEINSEARCH	Especifica que se incorporen los valores perdidos en el cálculo del valor de una regla de división y, en consecuencia, que se produzca una regla de división que asocie los valores perdidos con una rama que maximice el valor de la división.
modelId	Especifica el nombre de la variable de ID del modelo a utilizar al generar el código de puntuación SAS. Por defecto, se prefija DT_ al nombre de la variable objetivo.
modelTable	Especifica la tabla que contiene el modelo. Para obtener más información, consulte el parámetro castable común.
monoDec	Especifica las entradas de intervalo cuya predicción no debe aumentar cuando el valor de entrada aumenta. No se garantiza el cumplimiento perfecto.
monoInc	Especifica las entradas de intervalo cuya predicción no debe disminuir cuando el valor de entrada aumenta. No se garantiza el cumplimiento perfecto.
nBins	Especifica el número de bins a utilizar para las variables numéricas en el cálculo del árbol de decisión.
nominalHandling
nominals	Especifica las variables de entrada nominales a utilizar en el análisis. Para obtener más información, consulte el parámetro casinvardesc común.
nominalSearch	Especifica el método para encontrar una división en una entrada nominal.
nominalSearch.handling
nominalSearch.maxCategories	Especifica el número máximo de niveles que debe incluir una regla de división.
nominalSearch.shrinkage	Especifica cuánto peso dar a la media de la categoría en el método de clasificación.
nominalSearch.sort	Especifica la cardinalidad mínima de una entrada para usar el método de clasificación.
nominalSearch.sortBy
nTree	Especifica el número de árboles a crear.
offset	Especifica una variable de desplazamiento a utilizar con distribution=POISSON o TWEEDIE.
phi	Este valor es útil para el parámetro de potencia en la distribución de Tweedie.
power	Este valor es útil para el parámetro de potencia en la distribución de Tweedie.
quantileBin	Especifica los límites del bin en los cuantiles de las entradas numéricas en lugar de bins de igual ancho.
ridge	Especifica la regularización de la norma L2 en la predicción. El valor debe ser mayor o igual a cero.
saveState	Especifica la tabla donde se almacenará el modelo aStore generado. Para obtener más información, consulte el parámetro casouttable común.
seed	Especifica la semilla para el generador de números aleatorios. Por defecto, la secuencia de números aleatorios se basa en el reloj del ordenador. Los valores negativos también dan como resultado secuencias de números aleatorios basadas en el reloj del ordenador. Si desea una secuencia de números aleatorios reproducible entre ejecuciones, especifique un valor mayor que cero.
singular	Especifica un valor pequeño para evitar el cero en la división.
subSampleRate	Especifica la fracción de los datos a utilizar para construir cada árbol.
table	Especifica la configuración para una tabla de entrada.
table.caslib	Especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente.
table.computedOnDemand	Cuando se establece en True, crea las variables calculadas cuando la tabla se carga en lugar de cuando comienza la acción.
table.computedVars	Especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente.
table.computedVarsProgram	Especifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
table.dataSourceOptions	Especifica las opciones de la fuente de datos.
table.importOptions	Especifica la configuración para leer una tabla desde una fuente de datos.
table.name	Especifica el nombre de la tabla de entrada.
table.singlePass	Cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas.
table.vars	Especifica las variables a utilizar en la acción.
table.where	Especifica una expresión para subconjuntar los datos de entrada.
table.whereTable	Especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se usan todos los nombres de variables que son comunes a la tabla de entrada y a la tabla de filtro para encontrar filas coincidentes. Si el parámetro where para la tabla de entrada y este parámetro se especifican, este filtro de tabla se aplica primero.
target	Especifica la variable objetivo o de respuesta para el entrenamiento. Si la variable es numérica, pero no se especifica en el parámetro nominal= y no se especifica nbinstarget=, se entrena un árbol de regresión.
transLearnBurn	Durante el aprendizaje por transferencia, especifica el número de árboles a crear antes de que comience la ponderación descendente de las observaciones auxiliares.
transLearnShrink	Durante el aprendizaje por transferencia, especifica cuánto ponderar a la baja los datos auxiliares improductivos.
transLearnTrim	Durante el aprendizaje por transferencia, especifica la fracción de la distribución de gradientes en los datos de entrenamiento más allá de la cual las observaciones auxiliares se ponderan a la baja.
validTable	Especifica la configuración para una tabla de entrada.
validTable.caslib	Especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente.
validTable.computedOnDemand	Cuando se establece en True, crea las variables calculadas cuando la tabla se carga en lugar de cuando comienza la acción.
validTable.computedVars	Especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente.
validTable.computedVarsProgram	Especifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
validTable.dataSourceOptions	Especifica las opciones de la fuente de datos.
validTable.importOptions	Especifica la configuración para leer una tabla desde una fuente de datos.
validTable.name	Especifica el nombre de la tabla de entrada.
validTable.singlePass	Cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas.
validTable.vars	Especifica las variables a utilizar en la acción.
validTable.where	Especifica una expresión para subconjuntar los datos de entrada.
validTable.whereTable	Especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se usan todos los nombres de variables que son comunes a la tabla de entrada y a la tabla de filtro para encontrar filas coincidentes. Si el parámetro where para la tabla de entrada y este parámetro se especifican, este filtro de tabla se aplica primero.
varImp	Especifica si se genera la información de importancia de la variable. El valor de importancia se determina por la reducción total de Gini.
varIntImp	Solicita la importancia de la interacción de variables y especifica el grado máximo de interacción.
weight	Especifica una variable numérica que contiene el peso de cada observación.

Preparación de datos Ver hoja de preparación de datos

Creación de datos (no proporcionado en HTML)

El documento HTML no proporciona un ejemplo explícito para la creación de datos de entrada. Normalmente, esto implicaría cargar o generar una tabla CAS con las variables necesarias para el entrenamiento del árbol de impulso de gradiente.

¡Copiado!

1	/* No se proporcionó código de creación de datos en el HTML */

Ejemplos

El documento HTML no proporciona ejemplos simples. Los ejemplos suelen ilustrar el uso básico de la acción.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	/* No se proporcionó código de ejemplo simple en el HTML */

Resultado :
No se proporcionó un resultado esperado para este tipo de ejemplo en el HTML.

El documento HTML no proporciona ejemplos detallados. Los ejemplos detallados suelen mostrar casos de uso más complejos con varias opciones de parámetros.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	/* No se proporcionó código de ejemplo detallado en el HTML */

Resultado :
No se proporcionó un resultado esperado para este tipo de ejemplo en el HTML.

FAQ

¿Especifica si la acción debe usar un orden de fila predefinido?

¿Especifica atributos temporales a aplicar a las variables de entrada?

¿Especifica una variable para el aprendizaje por transferencia que indica qué observaciones provienen de una fuente auxiliar?

¿Se conserva el orden de los bins para las variables numéricas?

¿Especifica la tabla donde se almacenará el modelo de árbol de decisión?

¿Solicita que la acción produzca código de puntuación SAS?

¿Solicita que la acción produzca código de puntuación SAS para crear variables que codifiquen interacciones?

¿Especifica la configuración para una tabla de salida?

¿Agrega comentarios al código del paso DATA?

¿Especifica el ancho a usar para formatear números derivados en el código del paso DATA?

¿Especifica el número de espacios para indentar el código del paso DATA para cada nivel?

¿Especifica el ID de la etiqueta a usar en los nombres de las matrices y las etiquetas de las sentencias en el código del paso DATA?

¿Especifica el tamaño de línea para el código generado?

¿Basa la comparación de variables con valores formateados en el ancho de formato completo con relleno?

¿Genera el código de una manera apropiada para almacenar en una tabla?

¿Especifica la distribución en el árbol de aumento de gradiente?

¿Especifica los criterios de parada anticipada para el entrenamiento?

¿Especifica la métrica de evaluación FCMP para los modelos de árbol de aumento de gradiente?

¿Indica si se busca el valor mínimo de la métrica?

¿Especifica el número de iteraciones sin mejora significativa antes de detener el entrenamiento?

¿Especifica un umbral para la métrica?

¿Especifica el número de iteraciones para aplicar el umbral?

¿Especifica la tolerancia para determinar una mejora significativa en la métrica?

¿Especifica si se deben codificar los nombres de las variables en la tabla de salida generada?

¿Especifica una variable numérica que contiene la frecuencia de ocurrencia de cada observación?

¿Se utiliza una búsqueda codiciosa o exhaustiva para determinar la mejor división para cada variable de cada nodo de árbol?

¿Se incluyen las observaciones con valores faltantes?

¿Especifica la predicción inicial?

¿Especifica las variables de entrada a usar en el análisis?

¿Especifica la regularización de la norma L1 en la predicción?

¿Especifica el número mínimo de observaciones en cada nodo?

¿Especifica la tasa de aprendizaje de cada árbol?

¿Especifica el nivel de registro?

¿Especifica el número de variables de entrada a considerar para la división en un nodo?

¿Especifica el número máximo de hijos (ramas) permitidos para cada nivel del árbol?

¿Especifica el número máximo del nivel del árbol?

¿Se fusionan los valores cuando el valor más grande en un bin coincide con el valor más bajo en un bin vecino?

¿Especifica un valor mínimo para el hessiano?

¿Especifica un umbral para utilizar valores faltantes en la búsqueda de división?

¿Especifica la política de valores faltantes para manejar valores faltantes?

¿Especifica el nombre de la variable de ID del modelo a usar al generar el código de puntuación SAS?

¿Especifica la tabla que contiene el modelo?

¿Especifica entradas de intervalo cuya predicción no debe aumentar cuando el valor de entrada aumenta?

¿Especifica entradas de intervalo cuya predicción no debe disminuir cuando el valor de entrada aumenta?

¿Especifica el número de bins a usar para variables numéricas en el cálculo del árbol de decisión?

¿Especifica el manejo de variables nominales?

¿Especifica las variables de entrada nominales a usar en el análisis?

¿Especifica el método para encontrar una división en una entrada nominal?

¿Especifica el manejo de la búsqueda nominal?

¿Especifica el número máximo de niveles que debe incluir una regla de división?

¿Especifica el peso a dar al promedio de la categoría en el método de ordenación?

¿Especifica la cardinalidad mínima de una entrada para usar el método de ordenación?

¿Especifica el criterio de ordenación?

¿Especifica el número de árboles a crear?

¿Especifica una variable de desplazamiento a usar con 'distribution=POISSON' o 'TWEEDIE'?

¿Es este valor útil para el parámetro de potencia en la distribución Tweedie?

¿Especifica los límites del bin en los cuantiles de las entradas numéricas en lugar de bins de igual ancho?

¿Especifica la regularización de la norma L2 en la predicción?

¿Especifica la tabla donde se almacenará el modelo aStore generado?

¿Especifica la semilla para el generador de números aleatorios?

¿Especifica un valor pequeño para evitar el cero en la división?

¿Especifica la fracción de los datos a usar para construir cada árbol?

¿Especifica la configuración para una tabla de entrada?

¿Especifica la caslib para la tabla de entrada que desea usar con la acción?

¿Crea las variables calculadas cuando la tabla se carga en lugar de cuando comienza la acción?

¿Especifica los nombres de las variables calculadas a crear?

¿Especifica el formato a aplicar a la variable?

¿Especifica la longitud del campo de formato más la longitud de la precisión del formato?

¿Especifica la etiqueta descriptiva para la variable?

¿Especifica el nombre de la variable?

¿Especifica la longitud de la precisión del formato?

¿Especifica la longitud del campo de formato?

¿Especifica una expresión para cada variable calculada que incluye en el parámetro 'computedVars'?

¿Especifica las opciones de la fuente de datos?

¿Especifica la configuración para leer una tabla desde una fuente de datos?

¿Especifica el nombre de la tabla de entrada?

¿No crea una tabla transitoria en el servidor?

¿Especifica las variables a usar en la acción?

¿Especifica una expresión para subconjuntar los datos de entrada?

¿Especifica una tabla de entrada que contiene filas para usar como filtro WHERE?

¿Especifica la caslib para la tabla de filtro?

¿Especifica el nombre de la tabla de filtro?

¿Especifica las variables a usar de la tabla de filtro?

¿Especifica una expresión para subconjuntar los datos de la tabla de filtro?

¿Especifica la variable objetivo o de respuesta para el entrenamiento?

¿Durante el aprendizaje por transferencia, especifica el número de árboles a crear antes de que comience el ponderado a la baja de las observaciones auxiliares?

¿Durante el aprendizaje por transferencia, especifica cuánto ponderar a la baja los datos auxiliares improductivos?

¿Durante el aprendizaje por transferencia, especifica la fracción de la distribución de gradientes en los datos de entrenamiento más allá de la cual las observaciones auxiliares se ponderan a la baja?

¿Especifica la configuración para una tabla de entrada de validación?

¿Especifica si se genera la información de importancia de las variables?

¿Solicita la importancia de la interacción de variables y especifica el grado máximo de interacción?

¿Especifica una variable numérica que contiene el peso de cada observación?

Actions associées

decisionTree

forestCode

Genera código de puntuación de paso DATA (DATA step) a partir de un modelo de...

decisionTree

forestScore

Puntúa una tabla utilizando un modelo de bosque (forest) previamente entrenad...

decisionTree

forestTrain

Entrena un modelo de bosque (forest). Esta acción implementa algoritmos de bo...

decisionTree

gbtreeCode

Genera código de puntuación de paso DATA (DATA step) a partir de un modelo de...

decisionTree

gbtreeScore

Esta acción puntúa una tabla utilizando un modelo de árbol de potenciación de...

Tabla de contenidos

Entrenamiento de un modelo Gradient Boosting para la predicción de salario

Descripción

Creación de datos (no proporcionado en HTML)

Ejemplos

Ejemplo simple (no proporcionado en HTML)

Ejemplo detallado (no proporcionado en HTML)

FAQ

Actions associées

forestCode

forestScore

forestTrain

gbtreeCode

gbtreeScore