groupBy - WeAreCAS

Inhaltsverzeichnis

Codes SAS Liés

Erstellung einer gruppierten Tabelle

Tabellendetails (tableDetails-Aktion)

Laden einer CSV-Datei von einem Server

Erstellung einer Gruppierungstabelle

AHGhtml Makro - Generierung und Öffnung eines HTML-Berichts

Laden eines SAS-Datensatzes in CAS als verteilte Tabelle

Definition und Verwaltung von benutzerdefinierten CAS-Aktionen

GROUPBY Aggregationsbeispiel mit CASL und FedSQL

Beschreibung

Erstellt BY-Gruppen anhand der Variablenwertkombinationen, die durch die Variablen in der Variablenliste gegeben sind.

simple.groupBy <result=results> <status=rc> / aggregator="MAX" | "MEAN" | "MIN" | "N" | "SUM", attributes={{format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, casOut={ caslib="string",compress=TRUE | FALSE,indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string",lifetime=64-bit-integer,maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD",name="table-name",promote=TRUE | FALSE, replace=TRUE | FALSE,replication=integer,tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer,timeStamp="string",where={ "string-1" <, "string-2", ...>} }, descending=TRUE | FALSE, freq="variable-name", includeMissing=TRUE | FALSE, inputs={{format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, partition=TRUE | FALSE, repeatedTable=TRUE | FALSE, resultLimit=integer, scoreGt=double, scoreLt=double, * table={ caslib="string",computedOnDemand=TRUE | FALSE,computedVars={{ format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, computedVarsProgram="string",dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND"|"SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, * name="table-name",singlePass=TRUE | FALSE,vars={{ format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, where="where-expression",whereTable={ casLib="string",dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND"|"SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, * name="table-name",vars={{ format="string",formattedLength=integer,label="string",* name="variable-name",nfd=integer,nfl=integer}, {...}}, where="where-expression"} }, weight="variable-name" ;

Einstellungen

Parameter	Beschreibung
aggregator	Gibt den Aggregator an, für den die Werte der Gewichtungsvariablen in einen Rangfolgenscore gerollt werden, wenn eine Gewichtungsvariable angegeben ist. Standard ist SUM. Verfügbare Optionen: MAX (maximaler Wert), MEAN (arithmetisches Mittel), MIN (minimaler Wert), N (Anzahl der Beobachtungen), SUM (Summe der nicht fehlenden Werte).
attributes	Gibt die Variablenattribute an. Für weitere Informationen zum Angeben des Parameters 'attributes' siehe den allgemeinen Parameter 'casinvardesc'.
casOut	Gibt die Einstellungen für eine Ausgabetabelle an. Für weitere Informationen zum Angeben des Parameters 'casOut' siehe den allgemeinen Parameter 'casouttable'.
descending	Wenn auf 'True' gesetzt, werden die Ebenen der Group-by-Variablen in absteigender Reihenfolge angeordnet. Standard ist 'False'.
freq	Gibt die numerische Häufigkeitsvariable an, die zur Berechnung der Rangfolge einer eindeutigen Gruppierung verwendet wird.
includeMissing	Wenn auf 'True' gesetzt, werden fehlende Werte bei der Bestimmung eindeutiger Werte in der Group-by-Analyse berücksichtigt. Standard ist 'True'.
inputs	Gibt die Eingabevariablen für die Analyse an. Für weitere Informationen zum Angeben des Parameters 'inputs' siehe den allgemeinen Parameter 'casinvardesc'.
partition	Wenn auf 'True' gesetzt, wird davon ausgegangen, dass die Tabelle partitioniert ist. Standard ist 'False'.
repeatedTable	Wenn auf 'True' gesetzt, wird eine wiederholte Group-by-Tabelle mit denselben Zeilen auf allen Worker-Knoten generiert. Standard ist 'False'.
resultLimit	Gibt die maximale Anzahl der zurückzugebenden eindeutigen Gruppierungen an. Bereich: 0–MACINT.
scoreGt	Gibt die exklusive Untergrenze der numerischen Rangfolgenscores der zurückzugebenden eindeutigen Gruppierungen an.
scoreLt	Gibt die exklusive Obergrenze der numerischen Rangfolgenscores der zurückzugebenden eindeutigen Gruppierungen an.
table	Gibt den Tabellennamen, die Caslib und andere allgemeine Parameter an. Dies ist ein erforderlicher Parameter. Der Wert kann 'caslib', 'computedOnDemand', 'computedVars', 'computedVarsProgram', 'dataSourceOptions', 'importOptions', 'name', 'singlePass', 'vars', 'where' und 'whereTable' enthalten.
table-caslib	Gibt die Caslib für die Eingabetabelle an, die Sie mit der Aktion verwenden möchten. Standardmäßig wird die aktive Caslib verwendet. Geben Sie nur einen Wert an, wenn Sie auf eine Tabelle aus einer anderen Caslib zugreifen müssen.
table-computedOnDemand	Wenn auf 'True' gesetzt, werden die berechneten Variablen beim Laden der Tabelle anstatt beim Beginn der Aktion erstellt. Standard ist 'False'.
table-computedVars	Gibt die Namen der zu erstellenden berechneten Variablen an. Geben Sie einen Ausdruck für jede Variable im Parameter 'computedVarsProgram' an. Wenn Sie diesen Parameter nicht angeben, werden alle Variablen aus 'computedVarsProgram' automatisch eingeschlossen.
table-computedVars-format	Gibt das auf die Variable anzuwendende Format an.
table-computedVars-formattedLength	Gibt die Länge des Formatfelds plus die Länge der Formatgenauigkeit an.
table-computedVars-label	Gibt die beschreibende Bezeichnung für die Variable an.
table-computedVars-name	Gibt den Namen für die Variable an. Dies ist ein erforderlicher Parameter.
table-computedVars-nfd	Gibt die Länge der Formatgenauigkeit an.
table-computedVars-nfl	Gibt die Länge des Formatfelds an.
table-computedVarsProgram	Gibt einen Ausdruck für jede berechnete Variable an, die Sie in den Parameter 'computedVars' aufnehmen.
table-dataSourceOptions	Gibt Datenquellenoptionen an.
table-importOptions	Gibt die Einstellungen zum Lesen einer Tabelle aus einer Datenquelle an.
table-name	Gibt den Namen der Eingabetabelle an. Dies ist ein erforderlicher Parameter.
table-singlePass	Wenn auf 'True' gesetzt, wird keine temporäre Tabelle auf dem Server erstellt. Das Setzen dieses Parameters auf 'True' kann effizient sein, aber die Daten haben möglicherweise keine stabile Reihenfolge bei wiederholten Ausführungen. Standard ist 'False'.
table-vars	Gibt die in der Aktion zu verwendenden Variablen an.
table-vars-format	Gibt das auf die Variable anzuwendende Format an.
table-vars-formattedLength	Gibt die Länge des Formatfelds plus die Länge der Formatgenauigkeit an.
table-vars-label	Gibt die beschreibende Bezeichnung für die Variable an.
table-vars-name	Gibt den Namen für die Variable an. Dies ist ein erforderlicher Parameter.
table-vars-nfd	Gibt die Länge der Formatgenauigkeit an.
table-vars-nfl	Gibt die Länge des Formatfelds an.
table-where	Gibt einen Ausdruck zum Unterteilen der Eingabedaten an.
table-whereTable	Gibt eine Eingabetabelle an, die Zeilen enthält, die als WHERE-Filter verwendet werden sollen. Wenn der Parameter 'vars' nicht angegeben ist, werden alle Variablennamen, die sowohl in der Eingabetabelle als auch in der Filtertabelle vorhanden sind, verwendet, um übereinstimmende Zeilen zu finden. Wenn der Parameter 'where' für die Eingabetabelle und dieser Parameter angegeben sind, wird diese Filtertabelle zuerst angewendet.
table-whereTable-casLib	Gibt die Caslib für die Filtertabelle an. Standardmäßig wird die aktive Caslib verwendet.
table-whereTable-dataSourceOptions	Gibt Datenquellenoptionen an. Für weitere Informationen zum Angeben des Parameters 'dataSourceOptions' siehe den allgemeinen Parameter 'dataSourceOptions'.
table-whereTable-importOptions	Gibt die Einstellungen zum Lesen einer Tabelle aus einer Datenquelle an. Für weitere Informationen zum Angeben des Parameters 'importOptions' siehe den allgemeinen Parameter 'importOptions'.
table-whereTable-name	Gibt den Namen der Filtertabelle an. Dies ist ein erforderlicher Parameter.
table-whereTable-vars	Gibt die aus der Filtertabelle zu verwendenden Variablennamen an.
table-whereTable-vars-format	Gibt das auf die Variable anzuwendende Format an.
table-whereTable-vars-formattedLength	Gibt die Länge des Formatfelds plus die Länge der Formatgenauigkeit an.
table-whereTable-vars-label	Gibt die beschreibende Bezeichnung für die Variable an.
table-whereTable-vars-name	Gibt den Namen für die Variable an. Dies ist ein erforderlicher Parameter.
table-whereTable-vars-nfd	Gibt die Länge der Formatgenauigkeit an.
table-whereTable-vars-nfl	Gibt die Länge des Formatfelds an.
table-whereTable-where	Gibt einen Ausdruck zum Unterteilen der Daten aus der Filtertabelle an.
weight	Gibt die numerische Gewichtungsvariable an, die zur Berechnung des Rangfolgenscores einer eindeutigen Gruppierung verwendet wird.

Beispiele

Actions associées

simple

compare

Vergleicht zwei Tabellen, indem der Index und die Häufigkeit jeder Gruppe, di...

simple

correlation

Die Aktion `simple.correlation` berechnet Pearson-Produkt-Moment-Korrelatione...

simple

crossTab

Führt ein- oder zweidimensionale Tabellierungen durch. Diese Aktion ist grund...

simple

freq

Erstellt eine Häufigkeitsverteilung für eine oder mehrere Variablen. Diese Ak...

simple

mdSummary

Berechnet mehrdimensionale Zusammenfassungen von numerischen Variablen. Diese...