gVarCluster

gvarcluster

Beschreibung

Bietet eine Aktion zum Durchführen von Variablen-Clustering und zum Bereitstellen eines ungerichteten Netzwerks zum Untersuchen von Beziehungen zwischen Variablen.

gVarCluster.gvarcluster <result=results> <status=rc> / attributes={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, collection={{details=TRUE | FALSE, name="string", vars={"variable-name-1" <, "variable-name-2">}}, {...}}, diagnostics={eyecatcher="string"}, display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2">}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, exact=TRUE | FALSE, freq="variable-name", inputs={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, maxIter=64-bit-integer, maxMember=64-bit-integer, maxSteps=64-bit-integer, minCluster=64-bit-integer, multimember={{details=TRUE | FALSE, name="string", noEffect=TRUE | FALSE, stdize=TRUE | FALSE, vars={"variable-name-1" <, "variable-name-2">}, weight={"variable-name-1" <, "variable-name-2">}}, {...}}, nominals={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, outCP={casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2">}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2">}}, eps=double, list=TRUE | FALSE}, outEdge={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2">}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2">}}, outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2">} | {key-1={casouttable-1} <, key-2={casouttable-2}>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, outTree={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2">}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2">}}, outVert={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2">}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2">}}, polynomial={{degree=integer, details=TRUE | FALSE, labelStyle={expand=TRUE | FALSE, exponent="string", includeName=TRUE | FALSE, productSymbol="NONE" | "string"}, mDegree=integer, name="string", noSeparate=TRUE | FALSE, standardize={method="MOMENTS" | "MRANGE" | "WMOMENTS", options="CENTER" | "CENTERSCALE" | "NONE" | "SCALE", prefix="NONE" | "string"}, vars={"variable-name-1" <, "variable-name-2">}}, {...}}, rho=double, select="ADJBIC" | "CV" | "NONE" | "PENALIZED", stop=64-bit-integer, table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, target="string", weight="variable-name", xTol=double;
Einstellungen
ParameterBeschreibung
attributesÄndert die Attribute von Variablen, die in dieser Aktion verwendet werden. Derzeit werden Attribute, die in den Parametern inputs und nominals angegeben sind, ignoriert. Weitere Informationen zur Angabe des Parameters attributes finden Sie im gemeinsamen Parameter casinvardesc (Anhang A: Allgemeine Parameter).
collectionDefiniert eine Reihe von Variablen, die als einzelner Effekt mit mehreren Freiheitsgraden behandelt werden. Der collection-Wert kann einer oder mehrere der folgenden sein: details: Wenn auf True gesetzt, wird eine Tabelle angefordert, die zusätzliche Details zu diesem Effekt anzeigt. Standard: FALSE. name: Gibt den Namen des Effekts an. vars: Gibt eine Reihe von Variablen an, die als einzelner Effekt mit mehreren Freiheitsgraden behandelt werden. Die Spalten in der Designmatrix, die durch einen Sammlungseffekt beigetragen werden, sind die Designspalten der konstituierenden Variablen in der Reihenfolge, in der sie in der Definition des Sammlungseffekts erscheinen.
diagnosticseyecatcher: Gibt eine Zeichenkette an, die allen Nachrichten, die mit diesem Aktionsaufruf verbunden sind, vorangestellt wird.
displayGibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen. Weitere Informationen zur Angabe des display-Parameters finden Sie im gemeinsamen Parameter displayTables (Anhang A: Allgemeine Parameter).
exactWenn auf True gesetzt, wird eine grafische Variablen-Clusterung ohne Vorverarbeitung durch Schwellenwertbildung der Stichprobenkovarianz in verbundene Komponenten durchgeführt. Standardmäßig wird der Vorverarbeitungsschritt durchgeführt. Alias: noblock. Standard: FALSE.
freqBenennt die numerische Variable, die die Häufigkeit des Auftretens für jede Beobachtung enthält.
inputsGibt die für die Analyse zu verwendenden Variablen an. Weitere Informationen zur Angabe des inputs-Parameters finden Sie im gemeinsamen Parameter casinvardesc (Anhang A: Allgemeine Parameter). Alias: input.
maxIterGibt die maximale Anzahl von Iterationen für die Schätzung der dünnbesetzten Präzisionskovarianzmatrix mithilfe des Koordinatenabstiegs an. Standard: 50. Bereich: 1–100000.
maxMemberStoppt die Aktion, wenn die Anzahl der Mitglieder innerhalb eines Clusters größer oder gleich dem angegebenen Wert ist. Bereich: 1–100000.
maxStepsGibt die maximale Anzahl von Clustering-Schritten an. Standard: 3. Bereich: 1–50.
minClusterStoppt die Aktion, wenn die Anzahl der Cluster kleiner oder gleich dem angegebenen Wert ist. Standard: 3. Bereich: 1–100000.
multimemberVerwendet eine oder mehrere Klassifikationsvariablen, die im Parameter vars angegeben sind, so dass jede Beobachtung mit einer oder mehreren Ebenen der Vereinigung der Ebenen der Klassifikationsvariablen assoziiert werden kann. Weitere Informationen zur Angabe des multimember-Parameters finden Sie im gemeinsamen Parameter multimember (Anhang A: Allgemeine Parameter).
nominalsGibt nominale Variablen an, die für die Analyse verwendet werden sollen. Weitere Informationen zur Angabe des nominals-Parameters finden Sie im gemeinsamen Parameter casinvardesc (Anhang A: Allgemeine Parameter). Alias: nominal.
outCPErstellt einen Datensatz, der eine symmetrische Matrix enthält, die die Kovarianzen zwischen Variablen darstellt, und erstellt auch eine Reihe von Statistiken über den Eingabedatensatz und die Variablen. Der OutputCPStatement-Wert kann einer oder mehrere der folgenden sein: casOut: Gibt die Ausgabetabelle an. Weitere Informationen zur Angabe des casOut-Parameters finden Sie im gemeinsamen Parameter casouttable (Formular 1) (Anhang A: Allgemeine Parameter). eps: Gibt einen Epsilon-Wert an, so dass Matrixeinträge, deren Absolutwert kleiner als Epsilon ist, in der Ausgabe ignoriert werden. Sie müssen den list-Parameter angeben, wenn Sie den eps-Parameter angeben. Standard: 0. Minimalwert: 0. list: Wenn auf True gesetzt, wird die symmetrische Matrix im List-of-Lists (LIL)-Format ausgegeben. Standard: FALSE.
outEdgeErstellt einen Datensatz zur Verwendung mit der Hypergroup-Aktion in der tkhypgrp-Aktionsbibliothek. Diese Tabelle enthält die Informationen, die die Kanten im Netzwerk definieren: _FROM_, _TO_ und _WEIGHT_. Weitere Informationen zur Angabe des outEdge-Parameters finden Sie im gemeinsamen Parameter casouttable (Formular 1) (Anhang A: Allgemeine Parameter).
outputTablesListet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen. Weitere Informationen zur Angabe des outputTables-Parameters finden Sie im gemeinsamen Parameter outputTables (Anhang A: Allgemeine Parameter). Alias: displayOut.
outTreeErstellt einen Datensatz, der ein Baumdiagramm zur Darstellung der hierarchischen Clustering-Ergebnisse darstellt. Das Baumdiagramm kann mit der DENDROGRAM-Anweisung in der Graph Template Language gezeichnet werden. Weitere Informationen zur Angabe des outTree-Parameters finden Sie im gemeinsamen Parameter casouttable (Formular 1) (Anhang A: Allgemeine Parameter).
outVertErstellt einen Datensatz zur Verwendung mit der Hypergroup-Aktion in der tkhypgrp-Aktionsbibliothek. Diese Tabelle enthält die Knoten im Netzwerk und deren Größe. Weitere Informationen zur Angabe des outVert-Parameters finden Sie im gemeinsamen Parameter casouttable (Formular 1) (Anhang A: Allgemeine Parameter).
polynomialGibt einen Polynomeffekt an. Alle angegebenen Variablen müssen numerisch sein. Eine Designmatrixspalte wird für jeden Term des angegebenen Polynoms generiert. Standardmäßig wird jeder dieser Terme für den Modellbildungsprozess als separater Effekt behandelt. Weitere Informationen zur Angabe des polynomial-Parameters finden Sie im gemeinsamen Parameter polynomial (Anhang A: Allgemeine Parameter). Alias: poly.
rhoGibt den Wert von rho an, der die Reihenfolge der Regulationsparameter [die erste Potenz von rho, die zweite Potenz von rho usw.] bestimmt, die bei sequenziellen Clustering-Schritten verwendet werden. Standard: 0.8.
selectWenn auf True gesetzt, wird eine grafische Variablen-Clusterung ohne Vorverarbeitung durch Schwellenwertbildung der Stichprobenkovarianz in verbundene Komponenten durchgeführt. Standardmäßig wird der Vorverarbeitungsschritt durchgeführt. Standard: NONE.
stopFordert an, dass die Aktion stoppt, wenn sich die Clustering-Ergebnisse in der zuvor angegebenen Anzahl aufeinanderfolgender Schritte nicht ändern, die in diesem Parameter angegeben ist. Standard: 3. Bereich: 2–100.
tableGibt die Einstellungen für eine Eingabetabelle an. Weitere Informationen zur Angabe des table-Parameters finden Sie im gemeinsamen Parameter castable (Formular 1) (Anhang A: Allgemeine Parameter).
targetGibt die Zielvariable an, die für die Analyse verwendet werden soll.
weightBenennt die numerische Variable, die für eine gewichtete Analyse der Daten verwendet werden soll.
xTolGibt die minimale absolute Toleranz an, bei der eine Iteration stoppt. Standard: 0.001. Minimalwert: 1E-12.

Beispiele