Entrena un árbol de impulso de gradiente. Esta acción requiere una licencia de SAS Visual Data Mining and Machine Learning.
| Parámetro | Descripción |
|---|---|
| applyRowOrder | Especifica que desea que la acción utilice un orden de filas preestablecido. Esto requiere el uso de los parámetros orderby y groupby en una llamada de acción table.partition preliminar. |
| attributes | Especifica atributos temporales, como un formato, para aplicar a las variables de entrada. Para obtener más información, consulte el parámetro casinvardesc común. |
| auxData | Especifica una variable para el aprendizaje por transferencia que indica qué observaciones provienen de una fuente auxiliar. Un valor de 0 indica una observación de entrenamiento tradicional. Otros valores indican datos auxiliares. |
| binOrder | Por defecto, el orden de los bins se conserva para las variables numéricas. Cuando se establece en False, el orden de los bins se ignora para las variables numéricas. |
| casOut | Especifica la tabla donde se almacenará el modelo de árbol de decisión. Si no se especifica, se genera un nombre aleatorio. Para obtener más información, consulte el parámetro casouttable común. |
| code | Solicita que la acción produzca código de puntuación SAS. Especifique parámetros adicionales. Para obtener más información, consulte el parámetro codegen común. |
| codeInteractions | Solicita que la acción produzca código de puntuación SAS para crear variables que codifiquen interacciones. También debe solicitar interacciones de variables de al menos grado 2. |
| distribution | Especifica la distribución en el árbol de impulso de gradiente. BINARY es útil para la clasificación binaria. GAUSSIAN es útil para árboles de regresión. MULTINOMIAL es útil para la distribución multinomial para la clasificación con más de dos clases. POISSON es útil para la distribución de Poisson. TWEEDIE es útil para la distribución de Tweedie. |
| earlyStop | El valor de tkcasdt_earlyStop puede ser uno o más de los siguientes: |
| earlyStop.metric | |
| earlyStop.minimum | |
| earlyStop.stagnation | |
| earlyStop.threshold | |
| earlyStop.thresholdIter | |
| earlyStop.tolerance | |
| encodeName | Especifica si se deben codificar los nombres de las variables, como las probabilidades predichas de un objetivo binario o nominal en la tabla casout generada. Las probabilidades predichas se nombran con el prefijo P_ en lugar de _DT_P_. |
| fcmpEvalMetric | Especifica la métrica de evaluación FCMP para los modelos de árbol de impulso de gradiente. |
| freq | Especifica una variable numérica que contiene la frecuencia de aparición de cada observación. |
| greedy | Por defecto, se utiliza una búsqueda codiciosa o exhaustiva para determinar la mejor división para cada variable de cada nodo de árbol. Cuando se establece en False, se aplica un algoritmo rápido y eficiente basado en la agrupación. Se recomienda establecer este parámetro en False para variables con alta cardinalidad. |
| includeMissing | Por defecto, se incluyen las observaciones con valores perdidos. Cuando se establece en False, las observaciones con valores perdidos para las variables utilizadas en el modelo de árbol se ignoran al puntuar. |
| initPred | |
| inputs | Especifica las variables de entrada a utilizar en el análisis. Para obtener más información, consulte el parámetro casinvardesc común. |
| lasso | Especifica la regularización de la norma L1 en la predicción. El valor debe ser mayor o igual a cero. |
| leafSize | Especifica el número mínimo de observaciones en cada nodo. |
| learningRate | Especifica la tasa de aprendizaje de cada árbol. |
| logLevel | |
| m | Especifica el número de variables de entrada a considerar para la división en un nodo. Las variables se seleccionan al azar de las variables de entrada para cada árbol. Por defecto, el bosque utiliza la raíz cuadrada del número de variables de entrada, redondeada al entero más cercano. Para el impulso de gradiente, se utiliza el número de variables de entrada. |
| maxBranch | Especifica el número máximo de hijos (ramas) permitidos para cada nivel del árbol. |
| maxLevel | Especifica el número máximo de nivel del árbol. |
| mergeBin | Por defecto, cuando el valor más grande en un bin coincide con el valor más bajo en un bin vecino, los valores se fusionan en el bin inferior. Cuando se establece en False, la acción no intenta fusionar los bins. |
| minHessian | |
| minUseInSearch | Especifica un umbral para utilizar valores perdidos en la búsqueda de división cuando el parámetro missing se establece en USEINSEARCH. Si el número de observaciones en las que la variable de división tiene valores perdidos en un nodo es mayor o igual al valor especificado, la acción inicia la política USEINSEARCH. De lo contrario, los valores perdidos se asignan a una rama popular. |
| missing | Especifica la política de valores perdidos para manejar valores perdidos. |
| missing.MACSMALL | Especifica que los valores perdidos para las variables numéricas se traten como el valor de máquina más pequeño y que los valores perdidos para las variables nominales se traten como un nivel separado. |
| missing.USEINSEARCH | Especifica que se incorporen los valores perdidos en el cálculo del valor de una regla de división y, en consecuencia, que se produzca una regla de división que asocie los valores perdidos con una rama que maximice el valor de la división. |
| modelId | Especifica el nombre de la variable de ID del modelo a utilizar al generar el código de puntuación SAS. Por defecto, se prefija DT_ al nombre de la variable objetivo. |
| modelTable | Especifica la tabla que contiene el modelo. Para obtener más información, consulte el parámetro castable común. |
| monoDec | Especifica las entradas de intervalo cuya predicción no debe aumentar cuando el valor de entrada aumenta. No se garantiza el cumplimiento perfecto. |
| monoInc | Especifica las entradas de intervalo cuya predicción no debe disminuir cuando el valor de entrada aumenta. No se garantiza el cumplimiento perfecto. |
| nBins | Especifica el número de bins a utilizar para las variables numéricas en el cálculo del árbol de decisión. |
| nominalHandling | |
| nominals | Especifica las variables de entrada nominales a utilizar en el análisis. Para obtener más información, consulte el parámetro casinvardesc común. |
| nominalSearch | Especifica el método para encontrar una división en una entrada nominal. |
| nominalSearch.handling | |
| nominalSearch.maxCategories | Especifica el número máximo de niveles que debe incluir una regla de división. |
| nominalSearch.shrinkage | Especifica cuánto peso dar a la media de la categoría en el método de clasificación. |
| nominalSearch.sort | Especifica la cardinalidad mínima de una entrada para usar el método de clasificación. |
| nominalSearch.sortBy | |
| nTree | Especifica el número de árboles a crear. |
| offset | Especifica una variable de desplazamiento a utilizar con distribution=POISSON o TWEEDIE. |
| phi | Este valor es útil para el parámetro de potencia en la distribución de Tweedie. |
| power | Este valor es útil para el parámetro de potencia en la distribución de Tweedie. |
| quantileBin | Especifica los límites del bin en los cuantiles de las entradas numéricas en lugar de bins de igual ancho. |
| ridge | Especifica la regularización de la norma L2 en la predicción. El valor debe ser mayor o igual a cero. |
| saveState | Especifica la tabla donde se almacenará el modelo aStore generado. Para obtener más información, consulte el parámetro casouttable común. |
| seed | Especifica la semilla para el generador de números aleatorios. Por defecto, la secuencia de números aleatorios se basa en el reloj del ordenador. Los valores negativos también dan como resultado secuencias de números aleatorios basadas en el reloj del ordenador. Si desea una secuencia de números aleatorios reproducible entre ejecuciones, especifique un valor mayor que cero. |
| singular | Especifica un valor pequeño para evitar el cero en la división. |
| subSampleRate | Especifica la fracción de los datos a utilizar para construir cada árbol. |
| table | Especifica la configuración para una tabla de entrada. |
| table.caslib | Especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente. |
| table.computedOnDemand | Cuando se establece en True, crea las variables calculadas cuando la tabla se carga en lugar de cuando comienza la acción. |
| table.computedVars | Especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. |
| table.computedVarsProgram | Especifica una expresión para cada variable calculada que incluya en el parámetro computedVars. |
| table.dataSourceOptions | Especifica las opciones de la fuente de datos. |
| table.importOptions | Especifica la configuración para leer una tabla desde una fuente de datos. |
| table.name | Especifica el nombre de la tabla de entrada. |
| table.singlePass | Cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas. |
| table.vars | Especifica las variables a utilizar en la acción. |
| table.where | Especifica una expresión para subconjuntar los datos de entrada. |
| table.whereTable | Especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se usan todos los nombres de variables que son comunes a la tabla de entrada y a la tabla de filtro para encontrar filas coincidentes. Si el parámetro where para la tabla de entrada y este parámetro se especifican, este filtro de tabla se aplica primero. |
| target | Especifica la variable objetivo o de respuesta para el entrenamiento. Si la variable es numérica, pero no se especifica en el parámetro nominal= y no se especifica nbinstarget=, se entrena un árbol de regresión. |
| transLearnBurn | Durante el aprendizaje por transferencia, especifica el número de árboles a crear antes de que comience la ponderación descendente de las observaciones auxiliares. |
| transLearnShrink | Durante el aprendizaje por transferencia, especifica cuánto ponderar a la baja los datos auxiliares improductivos. |
| transLearnTrim | Durante el aprendizaje por transferencia, especifica la fracción de la distribución de gradientes en los datos de entrenamiento más allá de la cual las observaciones auxiliares se ponderan a la baja. |
| validTable | Especifica la configuración para una tabla de entrada. |
| validTable.caslib | Especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente. |
| validTable.computedOnDemand | Cuando se establece en True, crea las variables calculadas cuando la tabla se carga en lugar de cuando comienza la acción. |
| validTable.computedVars | Especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. |
| validTable.computedVarsProgram | Especifica una expresión para cada variable calculada que incluya en el parámetro computedVars. |
| validTable.dataSourceOptions | Especifica las opciones de la fuente de datos. |
| validTable.importOptions | Especifica la configuración para leer una tabla desde una fuente de datos. |
| validTable.name | Especifica el nombre de la tabla de entrada. |
| validTable.singlePass | Cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas. |
| validTable.vars | Especifica las variables a utilizar en la acción. |
| validTable.where | Especifica una expresión para subconjuntar los datos de entrada. |
| validTable.whereTable | Especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se usan todos los nombres de variables que son comunes a la tabla de entrada y a la tabla de filtro para encontrar filas coincidentes. Si el parámetro where para la tabla de entrada y este parámetro se especifican, este filtro de tabla se aplica primero. |
| varImp | Especifica si se genera la información de importancia de la variable. El valor de importancia se determina por la reducción total de Gini. |
| varIntImp | Solicita la importancia de la interacción de variables y especifica el grado máximo de interacción. |
| weight | Especifica una variable numérica que contiene el peso de cada observación. |
El documento HTML no proporciona un ejemplo explícito para la creación de datos de entrada. Normalmente, esto implicaría cargar o generar una tabla CAS con las variables necesarias para el entrenamiento del árbol de impulso de gradiente.
| 1 | /* No se proporcionó código de creación de datos en el HTML */ |
El documento HTML no proporciona ejemplos simples. Los ejemplos suelen ilustrar el uso básico de la acción.
| 1 | /* No se proporcionó código de ejemplo simple en el HTML */ |
El documento HTML no proporciona ejemplos detallados. Los ejemplos detallados suelen mostrar casos de uso más complejos con varias opciones de parámetros.
| 1 | /* No se proporcionó código de ejemplo detallado en el HTML */ |