gmm

Q: ¿Qué es la acción gmm?

El modelo de mezcla gaussiana (gmm) es una acción del conjunto de acciones de Bayes no paramétrico. Se utiliza para modelar la distribución de datos mediante una combinación de funciones de densidad de probabilidad gaussianas.

Q: ¿Qué es el parámetro 'alpha'?

El parámetro 'alpha' especifica el parámetro de concentración para el proceso de Dirichlet.

Q: ¿Qué es el parámetro 'attributes'?

El parámetro 'attributes' cambia los atributos de las variables utilizadas en esta acción. Actualmente, los atributos especificados en los parámetros de entrada y nominales se ignoran. Para obtener más información, consulte el parámetro común 'casinvardesc'.

Q: ¿Qué es el parámetro 'clusterCovOut'?

El parámetro 'clusterCovOut' crea una tabla en el servidor que contiene la matriz de covarianza de cada clúster. Para obtener más información, consulte el parámetro común 'casouttable (Formulario 1)'.

Q: ¿Qué es el parámetro 'clusterSumOut'?

El parámetro 'clusterSumOut' crea una tabla en el servidor que contiene el resumen de los resultados de la agrupación, incluyendo el tamaño, el vecino y la media de cada clúster. Para obtener más información, consulte el parámetro común 'casouttable (Formulario 1)'.

Q: ¿Qué es el parámetro 'display'?

El parámetro 'display' especifica una lista de tablas de resultados para enviar al cliente para su visualización. Para obtener más información, consulte el parámetro común 'displayTables'.

Q: ¿Qué es el parámetro 'freq'?

El parámetro 'freq' nombra la variable numérica que contiene la frecuencia de ocurrencia para cada observación.

Q: ¿Qué es el parámetro 'inference'?

El parámetro 'inference' especifica el método de inferencia a utilizar en el análisis. El valor que especifique para el parámetro del método determina los otros parámetros que se aplican. El alias para este parámetro es 'infer'. Actualmente, el único método soportado es 'VB'.

Q: ¿Qué es el parámetro 'inputs'?

El parámetro 'inputs' especifica las variables a utilizar para el análisis. Para obtener más información, consulte el parámetro común 'casinvardesc'. El alias para este parámetro es 'input'.

Q: ¿Qué es el parámetro 'maxClusters'?

El parámetro 'maxClusters' especifica el número máximo de clústeres. El alias para este parámetro es 'nClusters'.

Descripción

Modelo de mezcla gaussiana. Este conjunto de acciones de Bayes no paramétrico permite especificar el parámetro de concentración para el proceso de Dirichlet y el número máximo de clústeres. También permite especificar el método de inferencia a utilizar en el análisis, incluyendo parámetros específicos del método como el tipo de matriz de covarianza y el número de iteraciones.

nonParametricBayes.gmm <result=results> <status=rc> / \ alpha=double, \ attributes={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, \ clusterCovOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, \ clusterSumOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, \ display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, \ freq="variable-name", \ inference={method="VB", method-specific-parameters}, \ inputs={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, \ maxClusters=integer, \ output={casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", onDemand=TRUE | FALSE, promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars="ALL" | "ALL_MODEL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}}, \ outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, \ saveState={caslib="string", label="string", lifetime=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE"}, \ seed=double, \ table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}};

Parámetros

Parámetro	Descripción
alpha	especifica el parámetro de concentración para el proceso de Dirichlet.
attributes	cambia los atributos de las variables utilizadas en esta acción. Actualmente, los atributos especificados en los parámetros de entrada y nominales son ignorados. Para más información sobre cómo especificar el parámetro de atributos, consulte el parámetro común casinvardesc (Apéndice A: Parámetros comunes).
clusterCovOut	crea una tabla en el servidor que contiene la matriz de covarianza de cada clúster. Para más información sobre cómo especificar el parámetro clusterCovOut, consulte el parámetro común casouttable (Forma 1) (Apéndice A: Parámetros comunes).
clusterSumOut	crea una tabla en el servidor que contiene el resumen de los resultados de la agrupación, incluyendo el tamaño, el vecino y la media de cada clúster. Para más información sobre cómo especificar el parámetro clusterSumOut, consulte el parámetro común casouttable (Forma 1) (Apéndice A: Parámetros comunes).
display	especifica una lista de tablas de resultados para enviar al cliente para su visualización. Para más información sobre cómo especificar el parámetro de visualización, consulte el parámetro común displayTables (Apéndice A: Parámetros comunes).
freq	nombra la variable numérica que contiene la frecuencia de ocurrencia para cada observación.
inference	especifica el método de inferencia a utilizar en el análisis. El valor que especifique para el parámetro del método determina los otros parámetros que se aplican.
inputs	especifica las variables a utilizar para el análisis. Para más información sobre cómo especificar el parámetro de entradas, consulte el parámetro común casinvardesc (Apéndice A: Parámetros comunes).
maxClusters	especifica el número máximo de clústeres.
output	crea una tabla en el servidor que contiene el clúster predicho, así como la distribución de probabilidad sobre todos los clústeres obtenidos para cada observación. Para más información sobre cómo especificar el parámetro de salida, consulte el parámetro común outputStatement (Apéndice A: Parámetros comunes).
outputTables	enumera los nombres de las tablas de resultados que se guardarán como tablas CAS en el servidor. Para más información sobre cómo especificar el parámetro outputTables, consulte el parámetro común outputTables (Apéndice A: Parámetros comunes).
saveState	especifica la tabla en la que se guardará el estado del modelo para futuras predicciones del modelo. El valor de casouttable puede ser uno o más de los siguientes: - caslib: especifica el nombre de la caslib para la tabla de salida. - label: especifica la etiqueta descriptiva para asociar con la tabla. - lifetime: especifica el número de segundos que se mantendrá la tabla en memoria después de su último acceso. La tabla se elimina si no se accede a ella durante el número de segundos especificado. Predeterminado: 0, Valor mínimo: 0 - memoryFormat: especifica el formato de memoria para la tabla de salida. Predeterminado: INHERIT - DVR: utiliza el formato de memoria de reducción de valores duplicados. Este formato de memoria puede reducir el consumo de memoria y el tamaño del archivo cuando los datos de entrada contienen valores duplicados. - INHERIT: utiliza el formato de memoria predeterminado que está configurado para el servidor. Por defecto, el servidor utiliza el formato de memoria estándar. Si un administrador configura la variable de entorno CAS_DEFAULT_MEMORY_FORMAT a DVR, entonces el formato de memoria DVR se establece como predeterminado para el servidor. - STANDARD: utiliza el formato de memoria estándar. - name: especifica el nombre para la tabla de salida. - promote: cuando se establece en True, añade la tabla con un ámbito global. Esto permite que otras sesiones accedan a la tabla, sujeto a los controles de acceso. La caslib de destino también debe tener un ámbito global. Predeterminado: FALSE - replace: cuando se establece en True, sobrescribe una tabla existente que tenga el mismo nombre. Predeterminado: FALSE - tableRedistUpPolicy: Especifica la Política de Redistribución de Tablas cuando el número de pods de trabajo aumenta en un servidor CAS en ejecución. - DEFER: Aplazar la selección de la política de redistribución a una entidad de nivel superior. - NOREDIST: No redistribuir los datos de la tabla cuando el número de pods de trabajo cambia en un servidor CAS en ejecución. - REBALANCE: Reequilibrar los datos de la tabla cuando el número de pods de trabajo cambia en un servidor CAS en ejecución.
seed	especifica un valor doble para usar al iniciar el generador de números pseudoaleatorios para la inicialización. Predeterminado: 0, Valor mínimo: 0
table	especifica la tabla de datos de entrada. El valor de castable puede ser uno o más de los siguientes: - caslib: especifica la caslib para la tabla de entrada que desea utilizar con la acción. Por defecto, se utiliza la caslib activa. Especifique un valor solo si necesita acceder a una tabla de una caslib diferente. - computedOnDemand: cuando se establece en True, crea las variables calculadas cuando la tabla se carga en lugar de cuando comienza la acción. Alias: compOnDemand, Predeterminado: FALSE - computedVars: especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente. Alias: compVars - computedVarsProgram: especifica una expresión para cada variable calculada que incluya en el parámetro computedVars. Alias: compPgm - dataSourceOptions: especifica las opciones de la fuente de datos. Alias: options, dataSource. - importOptions: especifica la configuración para leer una tabla de una fuente de datos. Alias: import. Para más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions (Apéndice A: Parámetros comunes). - name: especifica el nombre de la tabla de entrada. - singlePass: cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero los datos podrían no tener un orden estable en ejecuciones repetidas. Predeterminado: FALSE - vars: especifica las variables a utilizar en la acción. - where: especifica una expresión para subconjuntos de los datos de entrada. - whereTable: especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si no se especifica el parámetro vars, todas las variables que son comunes a la tabla de entrada y a la tabla de filtrado se utilizan para encontrar filas coincidentes. Si se especifican el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero. - casLib: especifica la caslib para la tabla de filtro. Por defecto, se utiliza la caslib activa. - dataSourceOptions: especifica las opciones de la fuente de datos. Alias: options, dataSource. Para más información sobre cómo especificar el parámetro dataSourceOptions, consulte el parámetro común dataSourceOptions (Apéndice A: Parámetros comunes). - importOptions: especifica la configuración para leer una tabla de una fuente de datos. Alias: import. Para más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions (Apéndice A: Parámetros comunes). - name: especifica el nombre de la tabla de filtro. - vars: especifica los nombres de las variables a utilizar de la tabla de filtro. - where: especifica una expresión para subconjuntos de los datos de la tabla de filtro.
covariance	especifica el tipo de matriz de covarianza de las mezclas gaussianas. Predeterminado: DIAGONAL
maxVbIter	especifica el número de iteraciones para la inferencia bayesiana variacional (VB).
threshold	especifica el umbral de la diferencia entre las verosimilitudes actual y anterior.

Ejemplos

FAQ

¿Qué es la acción gmm?

¿Cuál es la sintaxis CASL para la acción gmm?

¿Qué es el parámetro 'alpha'?

¿Qué es el parámetro 'attributes'?

¿Qué es el parámetro 'clusterCovOut'?

¿Qué es el parámetro 'clusterSumOut'?

¿Qué es el parámetro 'display'?

¿Qué es el parámetro 'freq'?

¿Qué es el parámetro 'inference'?

¿Qué es el parámetro 'inputs'?

¿Qué es el parámetro 'maxClusters'?

¿Qué es el parámetro 'output'?

¿Qué es el parámetro 'outputTables'?

¿Qué es el parámetro 'saveState'?

¿Qué es el parámetro 'seed'?

¿Qué es el parámetro 'table'?

¿Qué es el parámetro 'covariance' para el método 'VB'?

¿Qué es el parámetro 'maxVbIter' para el método 'VB'?

¿Qué es el parámetro 'threshold' para el método 'VB'?

Actions associées

nonParametricBayes

gpClass

Clasificación de procesos gaussianos.

nonParametricBayes

gpReg

Aprende un modelo de regresión de procesos gaussianos.

Tabla de contenidos

Macro addvar - División de variables de texto

Descripción

Ejemplos

FAQ

Actions associées

gpClass

gpReg