nonParametricBayes

gmm

Description

Modèle de mélange gaussien.

nonParametricBayes.gmm <result=results> <status=rc> / alpha=double, attributes={{format="string", formattedLength=integer, label="string", *name="variable-name", nfd=integer, nfl=integer}}, {...}}, clusterCovOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, clusterSumOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, freq="variable-name", inference={method="VB", covariance="DIAGONAL" | "FULL", maxVbIter=64-bit-integer, threshold=double}, inputs={{format="string", formattedLength=integer, label="string", *name="variable-name", nfd=integer, nfl=integer}}, {...}}, maxClusters=integer, output={{casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", onDemand=TRUE | FALSE, promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars="ALL" | "ALL_MODEL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}}}, outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, saveState={caslib="string", label="string", lifetime=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE"}, seed=double, *table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", *name="variable-name", nfd=integer, nfl=integer}}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, *name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", *name="variable-name", nfd=integer, nfl=integer}}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, *name="table-name", vars={{format="string", formattedLength=integer, label="string", *name="variable-name", nfd=integer, nfl=integer}}, {...}}, where="where-expression"}}; Parameters pour la méthode "VB": covariance="DIAGONAL" | "FULL" maxVbIter=64-bit-integer threshold=double
Paramètres
ParamètreDescription
alphaspécifie le paramètre de concentration pour le processus de Dirichlet.
attributesmodifie les attributs des variables utilisées dans cette action. Actuellement, les attributs spécifiés sur les paramètres 'inputs' et 'nominals' sont ignorés. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre casinvardesc commun.
attributes.formatspécifie le format à appliquer à la variable.
attributes.formattedLengthspécifie la longueur du champ de format plus la longueur de la précision du format.
attributes.labelspécifie l'étiquette descriptive de la variable.
attributes.namespécifie le nom de la variable (obligatoire).
attributes.nfdspécifie la longueur de la précision du format.
attributes.nflspécifie la longueur du champ de format.
clusterCovOutcrée une table sur le serveur qui contient la matrice de covariance de chaque cluster. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre casouttable commun (Formulaire 1).
clusterSumOutcrée une table sur le serveur qui contient le résumé des résultats du clustering, y compris la taille, le voisin et la moyenne de chaque cluster. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre casouttable commun (Formulaire 1).
displayspécifie une liste de tables de résultats à envoyer au client pour affichage. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre displayTables commun.
freqnomme la variable numérique qui contient la fréquence d'occurrence pour chaque observation.
inferencespécifie la méthode d'inférence à utiliser dans l'analyse. La valeur que vous spécifiez pour le paramètre 'method' détermine les autres paramètres qui s'appliquent.
inference.methodMéthode d'inférence. 'VB' signifie inférence bayésienne variationnelle (valeur par défaut).
inference.covariancespécifie le type de matrice de covariance des mélanges gaussiens. 'DIAGONAL' est la valeur par défaut. 'FULL' peut également être spécifié.
inference.maxVbIterspécifie le nombre d'itérations pour l'inférence bayésienne variationnelle (VB).
inference.thresholdspécifie le seuil de la différence entre les vraisemblances actuelle et précédente.
inputsspécifie les variables à utiliser pour l'analyse. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre casinvardesc commun.
maxClustersspécifie le nombre maximal de clusters.
outputcrée une table sur le serveur qui contient le cluster prédit ainsi que la distribution de probabilité sur tous les clusters obtenus pour chaque observation. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre outputStatement commun.
outputTablesliste les noms des tables de résultats à enregistrer en tant que tables CAS sur le serveur. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre outputTables commun.
saveStatespécifie la table dans laquelle enregistrer l'état du modèle pour une prédiction future. Pour plus d'informations sur la spécification de ce paramètre, consultez la documentation du paramètre casouttable commun (Formulaire 1).
saveState.caslibspécifie le nom de la caslib pour la table de sortie.
saveState.labelspécifie l'étiquette descriptive à associer à la table.
saveState.lifetimespécifie le nombre de secondes pendant lesquelles la table doit être conservée en mémoire après son dernier accès. La table est supprimée si elle n'est pas accédée pendant le nombre de secondes spécifié.
saveState.memoryFormatspécifie le format de mémoire pour la table de sortie. 'DVR' utilise le format de mémoire de réduction des valeurs dupliquées. 'INHERIT' utilise le format de mémoire par défaut du serveur. 'STANDARD' utilise le format de mémoire standard.
saveState.namespécifie le nom de la table de sortie.
saveState.promotelorsqu'il est défini sur Vrai, ajoute la table de sortie avec une portée globale. Cela permet à d'autres sessions d'accéder à la table, sous réserve des contrôles d'accès. La caslib cible doit également avoir une portée globale.
saveState.replacelorsqu'il est défini sur Vrai, écrase une table existante qui a le même nom.
saveState.tableRedistUpPolicySpécifie la politique de redistribution de la table lorsque le nombre de pods worker augmente sur un serveur CAS en cours d'exécution. Les options sont 'DEFER', 'NOREDIST', 'REBALANCE'.
seedspécifie une valeur numérique double à utiliser pour démarrer le générateur de nombres pseudo-aléatoires pour l'initialisation.
tablespécifie la table de données d'entrée (obligatoire).
table.caslibspécifie la caslib pour la table d'entrée que vous souhaitez utiliser avec l'action. Par défaut, la caslib active est utilisée.
table.computedOnDemandlorsqu'il est défini sur Vrai, crée les variables calculées lorsque la table est chargée au lieu du début de l'action.
table.computedVarsspécifie les noms des variables calculées à créer. Spécifiez une expression pour chaque variable dans le paramètre 'computedVarsProgram'. Si vous ne spécifiez pas ce paramètre, toutes les variables de 'computedVarsProgram' sont automatiquement incluses.
table.computedVarsProgramspécifie une expression pour chaque variable calculée que vous incluez dans le paramètre 'computedVars'.
table.dataSourceOptionsspécifie les options de la source de données.
table.importOptionsspécifie les paramètres de lecture d'une table à partir d'une source de données.
table.namespécifie le nom de la table d'entrée (obligatoire).
table.singlePasslorsqu'il est défini sur Vrai, ne crée pas de table transitoire sur le serveur. Définir ce paramètre sur Vrai peut être efficace, mais les données peuvent ne pas avoir un ordre stable lors d'exécutions répétées.
table.varsspécifie les variables à utiliser dans l'action.
table.wherespécifie une expression pour sous-échantillonner les données d'entrée.
table.whereTablespécifie une table d'entrée qui contient des lignes à utiliser comme filtre WHERE. Si le paramètre 'vars' n'est pas spécifié, tous les noms de variables communs à la table d'entrée et à la table de filtrage sont utilisés pour trouver les lignes correspondantes. Si le paramètre 'where' pour la table d'entrée et ce paramètre sont spécifiés, cette table de filtrage est appliquée en premier.
Préparation des Données Voir la fiche de ce code dataprep
Création de données

Le document HTML fourni ne contient pas d'exemples de création de données.

Copié !
1/* Aucun exemple de création de données fourni */

Exemples

FAQ

Qu'est-ce que l'action 'gmm'?
Quels sont les paramètres requis pour l'action 'gmm' en CASL?
Quel est le paramètre 'alpha' pour l'action 'gmm'?
Quel est le paramètre 'attributes' pour l'action 'gmm'?
Quel est le paramètre 'clusterCovOut' pour l'action 'gmm'?
Quel est le paramètre 'clusterSumOut' pour l'action 'gmm'?
Quel est le paramètre 'display' pour l'action 'gmm'?
Quel est le paramètre 'freq' pour l'action 'gmm'?
Quel est le paramètre 'inference' pour l'action 'gmm'?
Quel est le paramètre 'inputs' pour l'action 'gmm'?
Quel est le paramètre 'maxClusters' pour l'action 'gmm'?
Quel est le paramètre 'output' pour l'action 'gmm'?
Quel est le paramètre 'outputTables' pour l'action 'gmm'?
Quel est le paramètre 'saveState' pour l'action 'gmm'?
Quel est le paramètre 'seed' pour l'action 'gmm'?
Quel est le paramètre 'table' pour l'action 'gmm'?
Quels sont les paramètres pour la méthode d'inférence 'VB'?
Quel est le paramètre 'covariance' pour l'inférence 'method="VB"'?
Quel est le paramètre 'maxVbIter' pour l'inférence 'method="VB"'?
Quel est le paramètre 'threshold' pour l'inférence 'method="VB"'?