Modelo de mezcla gaussiana. Este conjunto de acciones de Bayes no paramétrico permite especificar el parámetro de concentración para el proceso de Dirichlet y el número máximo de clústeres. También permite especificar el método de inferencia a utilizar en el análisis, incluyendo parámetros específicos del método como el tipo de matriz de covarianza y el número de iteraciones.
| Parámetro | Descripción |
|---|---|
| alpha | especifica el parámetro de concentración para el proceso de Dirichlet. |
| attributes | cambia los atributos de las variables utilizadas en esta acción. Actualmente, los atributos especificados en los parámetros de entrada y nominales son ignorados. Para más información sobre cómo especificar el parámetro de atributos, consulte el parámetro común casinvardesc (Apéndice A: Parámetros comunes). |
| clusterCovOut | crea una tabla en el servidor que contiene la matriz de covarianza de cada clúster. Para más información sobre cómo especificar el parámetro clusterCovOut, consulte el parámetro común casouttable (Forma 1) (Apéndice A: Parámetros comunes). |
| clusterSumOut | crea una tabla en el servidor que contiene el resumen de los resultados de la agrupación, incluyendo el tamaño, el vecino y la media de cada clúster. Para más información sobre cómo especificar el parámetro clusterSumOut, consulte el parámetro común casouttable (Forma 1) (Apéndice A: Parámetros comunes). |
| display | especifica una lista de tablas de resultados para enviar al cliente para su visualización. Para más información sobre cómo especificar el parámetro de visualización, consulte el parámetro común displayTables (Apéndice A: Parámetros comunes). |
| freq | nombra la variable numérica que contiene la frecuencia de ocurrencia para cada observación. |
| inference | especifica el método de inferencia a utilizar en el análisis. El valor que especifique para el parámetro del método determina los otros parámetros que se aplican. |
| inputs | especifica las variables a utilizar para el análisis. Para más información sobre cómo especificar el parámetro de entradas, consulte el parámetro común casinvardesc (Apéndice A: Parámetros comunes). |
| maxClusters | especifica el número máximo de clústeres. |
| output | crea una tabla en el servidor que contiene el clúster predicho, así como la distribución de probabilidad sobre todos los clústeres obtenidos para cada observación. Para más información sobre cómo especificar el parámetro de salida, consulte el parámetro común outputStatement (Apéndice A: Parámetros comunes). |
| outputTables | enumera los nombres de las tablas de resultados que se guardarán como tablas CAS en el servidor. Para más información sobre cómo especificar el parámetro outputTables, consulte el parámetro común outputTables (Apéndice A: Parámetros comunes). |
| saveState | especifica la tabla en la que se guardará el estado del modelo para futuras predicciones del modelo. El valor de casouttable puede ser uno o más de los siguientes: - **caslib**: especifica el nombre de la caslib para la tabla de salida. - **label**: especifica la etiqueta descriptiva para asociar con la tabla. - **lifetime**: especifica el número de segundos que se mantendrá la tabla en memoria después de su último acceso. La tabla se elimina si no se accede a ella durante el número de segundos especificado. Predeterminado: 0, Valor mínimo: 0 - **memoryFormat**: especifica el formato de memoria para la tabla de salida. Predeterminado: INHERIT - **DVR**: utiliza el formato de memoria de reducción de valores duplicados. Este formato de memoria puede reducir el consumo de memoria y el tamaño del archivo cuando los datos de entrada contienen valores duplicados. - **INHERIT**: utiliza el formato de memoria predeterminado que está configurado para el servidor. Por defecto, el servidor utiliza el formato de memoria estándar. Si un administrador configura la variable de entorno CAS_DEFAULT_MEMORY_FORMAT a DVR, entonces el formato de memoria DVR se establece como predeterminado para el servidor. - **STANDARD**: utiliza el formato de memoria estándar. - **name**: especifica el nombre para la tabla de salida. - **promote**: cuando se establece en True, añade la tabla con un ámbito global. Esto permite que otras sesiones accedan a la tabla, sujeto a los controles de acceso. La caslib de destino también debe tener un ámbito global. Predeterminado: FALSE - **replace**: cuando se establece en True, sobrescribe una tabla existente que tenga el mismo nombre. Predeterminado: FALSE - **tableRedistUpPolicy**: Especifica la Política de Redistribución de Tablas cuando el número de pods de trabajo aumenta en un servidor CAS en ejecución. - **DEFER**: Aplazar la selección de la política de redistribución a una entidad de nivel superior. - **NOREDIST**: No redistribuir los datos de la tabla cuando el número de pods de trabajo cambia en un servidor CAS en ejecución. - **REBALANCE**: Reequilibrar los datos de la tabla cuando el número de pods de trabajo cambia en un servidor CAS en ejecución. |
| seed | especifica un valor doble para usar al iniciar el generador de números pseudoaleatorios para la inicialización. Predeterminado: 0, Valor mínimo: 0 |
| table | especifica la tabla de datos de entrada. El valor de castable puede ser uno o más de los siguientes: - **caslib**: especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente. - **computedOnDemand**: cuando se establece en True, crea las variables calculadas cuando la tabla se carga en lugar de cuando comienza la acción. Alias: compOnDemand, Predeterminado: FALSE - **computedVars**: especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. Alias: compVars - **computedVarsProgram**: especifica una expresión para cada variable calculada que incluya en el parámetro computedVars. Alias: compPgm - **dataSourceOptions**: especifica las opciones de la fuente de datos. Alias: options, dataSource. - **importOptions**: especifica la configuración para leer una tabla de una fuente de datos. Alias: import. Para más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions (Apéndice A: Parámetros comunes). - **name**: especifica el nombre de la tabla de entrada. - **singlePass**: cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas. Predeterminado: FALSE - **vars**: especifica las variables a utilizar en la acción. - **where**: especifica una expresión para subconjuntos de los datos de entrada. - **whereTable**: especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si no se especifica el parámetro vars, todas las variables que son comunes a la tabla de entrada y a la tabla de filtrado se utilizan para encontrar filas coincidentes. Si se especifican el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero. - **casLib**: especifica la caslib para la tabla de filtro. Por defecto, se utiliza la caslib activa. - **dataSourceOptions**: especifica las opciones de la fuente de datos. Alias: options, dataSource. Para más información sobre cómo especificar el parámetro dataSourceOptions, consulte el parámetro común dataSourceOptions (Apéndice A: Parámetros comunes). - **importOptions**: especifica la configuración para leer una tabla de una fuente de datos. Alias: import. Para más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions (Apéndice A: Parámetros comunes). - **name**: especifica el nombre de la tabla de filtro. - **vars**: especifica los nombres de las variables a utilizar de la tabla de filtro. - **where**: especifica una expresión para subconjuntos de los datos de la tabla de filtro. |
| covariance | especifica el tipo de matriz de covarianza de las mezclas gaussianas. Predeterminado: DIAGONAL |
| maxVbIter | especifica el número de iteraciones para la inferencia bayesiana variacional (VB). |
| threshold | especifica el umbral de la diferencia entre las verosimilitudes actual y anterior. |