simple

groupBy

Beschreibung

Erstellt BY-Gruppen anhand der Variablenwertkombinationen, die durch die Variablen in der Variablenliste gegeben sind.

simple.groupBy <result=results> <status=rc> / aggregator="MAX" | "MEAN" | "MIN" | "N" | "SUM", attributes={{format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, casOut={ caslib="string",compress=TRUE | FALSE,indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string",lifetime=64-bit-integer,maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD",name="table-name",promote=TRUE | FALSE, replace=TRUE | FALSE,replication=integer,tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer,timeStamp="string",where={ "string-1" <, "string-2", ...>} }, descending=TRUE | FALSE, freq="variable-name", includeMissing=TRUE | FALSE, inputs={{format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, partition=TRUE | FALSE, repeatedTable=TRUE | FALSE, resultLimit=integer, scoreGt=double, scoreLt=double, * table={ caslib="string",computedOnDemand=TRUE | FALSE,computedVars={{ format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, computedVarsProgram="string",dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND"|"SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, * name="table-name",singlePass=TRUE | FALSE,vars={{ format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, where="where-expression",whereTable={ casLib="string",dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND"|"SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, * name="table-name",vars={{ format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, where="where-expression"} }, weight="variable-name" ;
Einstellungen
ParameterBeschreibung
aggregator Gibt den Aggregator an, für den die Werte der Gewichtungsvariablen in einen Rangfolgenscore gerollt werden, wenn eine Gewichtungsvariable angegeben ist. Standard ist SUM. Verfügbare Optionen: MAX (maximaler Wert), MEAN (arithmetisches Mittel), MIN (minimaler Wert), N (Anzahl der Beobachtungen), SUM (Summe der nicht fehlenden Werte).
attributes Gibt die Variablenattribute an. Für weitere Informationen zum Angeben des Parameters 'attributes' siehe den allgemeinen Parameter 'casinvardesc'.
casOut Gibt die Einstellungen für eine Ausgabetabelle an. Für weitere Informationen zum Angeben des Parameters 'casOut' siehe den allgemeinen Parameter 'casouttable'.
descending Wenn auf 'True' gesetzt, werden die Ebenen der Group-by-Variablen in absteigender Reihenfolge angeordnet. Standard ist 'False'.
freq Gibt die numerische Häufigkeitsvariable an, die zur Berechnung der Rangfolge einer eindeutigen Gruppierung verwendet wird.
includeMissing Wenn auf 'True' gesetzt, werden fehlende Werte bei der Bestimmung eindeutiger Werte in der Group-by-Analyse berücksichtigt. Standard ist 'True'.
inputs Gibt die Eingabevariablen für die Analyse an. Für weitere Informationen zum Angeben des Parameters 'inputs' siehe den allgemeinen Parameter 'casinvardesc'.
partition Wenn auf 'True' gesetzt, wird davon ausgegangen, dass die Tabelle partitioniert ist. Standard ist 'False'.
repeatedTable Wenn auf 'True' gesetzt, wird eine wiederholte Group-by-Tabelle mit denselben Zeilen auf allen Worker-Knoten generiert. Standard ist 'False'.
resultLimit Gibt die maximale Anzahl der zurückzugebenden eindeutigen Gruppierungen an. Bereich: 0–MACINT.
scoreGt Gibt die exklusive Untergrenze der numerischen Rangfolgenscores der zurückzugebenden eindeutigen Gruppierungen an.
scoreLt Gibt die exklusive Obergrenze der numerischen Rangfolgenscores der zurückzugebenden eindeutigen Gruppierungen an.
table Gibt den Tabellennamen, die Caslib und andere allgemeine Parameter an. Dies ist ein erforderlicher Parameter. Der Wert kann 'caslib', 'computedOnDemand', 'computedVars', 'computedVarsProgram', 'dataSourceOptions', 'importOptions', 'name', 'singlePass', 'vars', 'where' und 'whereTable' enthalten.
table-caslib Gibt die Caslib für die Eingabetabelle an, die Sie mit der Aktion verwenden möchten. Standardmäßig wird die aktive Caslib verwendet. Geben Sie nur einen Wert an, wenn Sie auf eine Tabelle aus einer anderen Caslib zugreifen müssen.
table-computedOnDemand Wenn auf 'True' gesetzt, werden die berechneten Variablen beim Laden der Tabelle anstatt beim Beginn der Aktion erstellt. Standard ist 'False'.
table-computedVars Gibt die Namen der zu erstellenden berechneten Variablen an. Geben Sie einen Ausdruck für jede Variable im Parameter 'computedVarsProgram' an. Wenn Sie diesen Parameter nicht angeben, werden alle Variablen aus 'computedVarsProgram' automatisch eingeschlossen.
table-computedVars-format Gibt das auf die Variable anzuwendende Format an.
table-computedVars-formattedLength Gibt die Länge des Formatfelds plus die Länge der Formatgenauigkeit an.
table-computedVars-label Gibt die beschreibende Bezeichnung für die Variable an.
table-computedVars-name Gibt den Namen für die Variable an. Dies ist ein erforderlicher Parameter.
table-computedVars-nfd Gibt die Länge der Formatgenauigkeit an.
table-computedVars-nfl Gibt die Länge des Formatfelds an.
table-computedVarsProgram Gibt einen Ausdruck für jede berechnete Variable an, die Sie in den Parameter 'computedVars' aufnehmen.
table-dataSourceOptions Gibt Datenquellenoptionen an.
table-importOptions Gibt die Einstellungen zum Lesen einer Tabelle aus einer Datenquelle an.
table-name Gibt den Namen der Eingabetabelle an. Dies ist ein erforderlicher Parameter.
table-singlePass Wenn auf 'True' gesetzt, wird keine temporäre Tabelle auf dem Server erstellt. Das Setzen dieses Parameters auf 'True' kann effizient sein, aber die Daten haben möglicherweise keine stabile Reihenfolge bei wiederholten Ausführungen. Standard ist 'False'.
table-vars Gibt die in der Aktion zu verwendenden Variablen an.
table-vars-format Gibt das auf die Variable anzuwendende Format an.
table-vars-formattedLength Gibt die Länge des Formatfelds plus die Länge der Formatgenauigkeit an.
table-vars-label Gibt die beschreibende Bezeichnung für die Variable an.
table-vars-name Gibt den Namen für die Variable an. Dies ist ein erforderlicher Parameter.
table-vars-nfd Gibt die Länge der Formatgenauigkeit an.
table-vars-nfl Gibt die Länge des Formatfelds an.
table-where Gibt einen Ausdruck zum Unterteilen der Eingabedaten an.
table-whereTable Gibt eine Eingabetabelle an, die Zeilen enthält, die als WHERE-Filter verwendet werden sollen. Wenn der Parameter 'vars' nicht angegeben ist, werden alle Variablennamen, die sowohl in der Eingabetabelle als auch in der Filtertabelle vorhanden sind, verwendet, um übereinstimmende Zeilen zu finden. Wenn der Parameter 'where' für die Eingabetabelle und dieser Parameter angegeben sind, wird diese Filtertabelle zuerst angewendet.
table-whereTable-casLib Gibt die Caslib für die Filtertabelle an. Standardmäßig wird die aktive Caslib verwendet.
table-whereTable-dataSourceOptions Gibt Datenquellenoptionen an. Für weitere Informationen zum Angeben des Parameters 'dataSourceOptions' siehe den allgemeinen Parameter 'dataSourceOptions'.
table-whereTable-importOptions Gibt die Einstellungen zum Lesen einer Tabelle aus einer Datenquelle an. Für weitere Informationen zum Angeben des Parameters 'importOptions' siehe den allgemeinen Parameter 'importOptions'.
table-whereTable-name Gibt den Namen der Filtertabelle an. Dies ist ein erforderlicher Parameter.
table-whereTable-vars Gibt die aus der Filtertabelle zu verwendenden Variablennamen an.
table-whereTable-vars-format Gibt das auf die Variable anzuwendende Format an.
table-whereTable-vars-formattedLength Gibt die Länge des Formatfelds plus die Länge der Formatgenauigkeit an.
table-whereTable-vars-label Gibt die beschreibende Bezeichnung für die Variable an.
table-whereTable-vars-name Gibt den Namen für die Variable an. Dies ist ein erforderlicher Parameter.
table-whereTable-vars-nfd Gibt die Länge der Formatgenauigkeit an.
table-whereTable-vars-nfl Gibt die Länge des Formatfelds an.
table-whereTable-where Gibt einen Ausdruck zum Unterteilen der Daten aus der Filtertabelle an.
weight Gibt die numerische Gewichtungsvariable an, die zur Berechnung des Rangfolgenscores einer eindeutigen Gruppierung verwendet wird.

Beispiele