index - WeAreCAS

Q: Was ist der Zweck der Index-Aktion?

Die Index-Aktion erstellt Indizes auf einer oder mehreren Tabellenvariablen.

Q: Was sind die Einstellungen für eine Ausgabetabelle in der Index-Aktion?

Der casout-Parameter gibt die Einstellungen für eine Ausgabetabelle an. Alias ist outTable. Die Langform ist casout={name="table-name"}, die Kurzform ist casout="table-name".

Q: Was ist 'caslib' im casout-Parameter?

caslib gibt den Namen der Caslib für die Ausgabetabelle an.

Q: Was bewirkt 'compress' im casout-Parameter?

Wenn 'compress' auf True gesetzt ist, wird Datenkomprimierung auf die Tabelle angewendet. Der Standardwert ist FALSE.

Q: Was ist 'indexVars' im casout-Parameter?

indexVars gibt die Liste der Variablen an, für die Indizes in den Ausgabedaten erstellt werden sollen.

Q: Was ist 'label' im casout-Parameter?

label gibt die beschreibende Bezeichnung an, die der Tabelle zugeordnet werden soll.

Q: Was ist 'lifetime' im casout-Parameter?

lifetime gibt die Anzahl der Sekunden an, für die die Tabelle nach dem letzten Zugriff im Speicher gehalten wird. Die Tabelle wird gelöscht, wenn sie für die angegebene Anzahl von Sekunden nicht zugänglich ist. Der Standardwert ist 0, der Mindestwert ist 0.

Q: Was ist 'maxMemSize' im casout-Parameter?

maxMemSize gibt die maximale Speichermenge in Bytes an, die jeder Thread für In-Memory-Blöcke zuweisen sollte, bevor er in eine speicherabgebildete Datei konvertiert wird. Dateien werden in den Verzeichnissen geschrieben, die in der Umgebungsvariablen CAS_DISK_CACHE angegeben sind. Tipp: Sie können den Wert in Anführungszeichen setzen und B, K, M, G oder T als Suffix angeben, um die Einheiten anzugeben. Zum Beispiel steht '8M' für acht Megabyte.

Q: Was ist 'memoryFormat' im casout-Parameter?

memoryFormat gibt das Speicherformat für die Ausgabetabelle an. Der Standardwert ist INHERIT.

Q: Was bedeutet 'DVR' für 'memoryFormat'?

Verwenden Sie das Speicherformat zur Reduzierung doppelter Werte. Dieses Speicherformat kann den Speicherverbrauch und die Dateigröße reduzieren, wenn die Eingabedaten doppelte Werte enthalten.

Inhaltsverzeichnis

Codes SAS Liés

Data Engineering: Optimieren Sie I/O-Performance durch "In-Place" Modifikation (Indexing & Security Best Practices)

SAS Data Step I/O: Externe Dateien mit INFILE, FILE und Filerefs meistern

SAS-Performance optimieren: So nutzen Sie die Dataset-Option INDEX= effizient

Der ultimative SAS LIBNAME Guide: V9, SPDE, Hadoop & CAS meistern

Erstellung einer gruppierten Tabelle

Index erstellen

Variablen erstellen und Daten filtern mit DATA Step

Bezeichnungen und Formate anwenden

Modifikation von SAS-Datensätzen

Spalten in einer CAS-Tabelle indizieren

Beschreibung

Erstellt Indizes für eine oder mehrere Tabellenvariablen.

table.index <result=results> <status=rc> / casout={ caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string" }, table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", orderBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression", whereTable={ casLib="string", dataSourceOptions={ adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | greenplum-parameters | hadoop-parameters | hana-parameters | hdfs-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | netezza-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters }, importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, {...}}, where="where-expression" } } ;

Einstellungen

Parameter	Beschreibung
casout	Gibt die Einstellungen für eine Ausgabetabelle an.
casout.caslib	Gibt den Namen der Caslib für die Ausgabetabelle an.
casout.compress	Wenn auf 'True' gesetzt, wird die Datentabelle komprimiert.
casout.indexVars	Gibt die Liste der Variablen an, für die Indizes in den Ausgabedaten erstellt werden sollen.
casout.label	Gibt das beschreibende Label an, das der Tabelle zugeordnet werden soll.
casout.lifetime	Gibt die Anzahl der Sekunden an, für die die Tabelle nach dem letzten Zugriff im Speicher gehalten wird. Die Tabelle wird gelöscht, wenn sie für die angegebene Anzahl von Sekunden nicht aufgerufen wird. Standardwert: 0. Minimalwert: 0.
casout.maxMemSize	Gibt die maximale Speichermenge in Bytes an, die jeder Thread für In-Memory-Blöcke zuweisen sollte, bevor er in eine speicherabgebildete Datei konvertiert wird. Dateien werden in den Verzeichnissen geschrieben, die in der Umgebungsvariablen CAS_DISK_CACHE angegeben sind. Tipp: Sie können den Wert in Anführungszeichen setzen und B, K, M, G oder T als Suffix angeben, um die Einheiten anzuzeigen. Zum Beispiel gibt "8M" acht Megabyte an.
casout.memoryFormat	Gibt das Speicherformat für die Ausgabetabelle an. Standardwert: INHERIT.
casout.memoryFormat.DVR	Verwendet das Speicherformat zur Reduzierung doppelter Werte. Dieses Speicherformat kann den Speicherverbrauch und die Dateigröße reduzieren, wenn die Eingabedaten doppelte Werte enthalten.
casout.memoryFormat.INHERIT	Verwendet das Standard-Speicherformat, das für den Server festgelegt ist. Standardmäßig verwendet der Server das Standard-Speicherformat. Wenn ein Administrator die Umgebungsvariable CAS_DEFAULT_MEMORY_FORMAT auf DVR setzt, wird das DVR-Speicherformat als Standard für den Server festgelegt.
casout.memoryFormat.STANDARD	Verwendet das Standard-Speicherformat.
casout.name	Gibt den Namen für die Ausgabetabelle an.
casout.promote	Wenn auf 'True' gesetzt, wird die Ausgabetabelle mit einem globalen Geltungsbereich hinzugefügt. Dies ermöglicht anderen Sitzungen den Zugriff auf die Tabelle, vorbehaltlich der Zugriffskontrollen. Die Ziel-Caslib muss ebenfalls einen globalen Geltungsbereich haben. Standardwert: FALSE.
casout.replace	Wenn auf 'True' gesetzt, wird eine vorhandene Tabelle mit demselben Namen überschrieben. Standardwert: FALSE.
casout.replication	Gibt die Anzahl der Kopien der Tabelle an, die für die Fehlertoleranz erstellt werden sollen. Größere Werte führen zu einer geringeren Leistung und verbrauchen mehr Speicher, bieten aber eine hohe Verfügbarkeit der Daten im Falle eines Knotenausfalls. Datenredundanz gilt nur für verteilte Server. Standardwert: 1. Minimalwert: 0.
casout.tableRedistUpPolicy	Gibt die Richtlinie zur Tabellenneuzuordnung an, wenn die Anzahl der Worker-Pods auf einem laufenden CAS-Server zunimmt.
casout.tableRedistUpPolicy.DEFER	Die Auswahl der Umverteilungsrichtlinie wird einer übergeordneten Entität überlassen.
casout.tableRedistUpPolicy.NOREDIST	Die Tabellendaten werden nicht neu verteilt, wenn sich die Anzahl der Worker-Pods auf einem laufenden CAS-Server ändert.
casout.tableRedistUpPolicy.REBALANCE	Die Tabellendaten werden neu ausbalanciert, wenn sich die Anzahl der Worker-Pods auf einem laufenden CAS-Server ändert.
casout.threadBlockSize	Gibt die Anzahl der Bytes an, die für Blöcke in der Ausgabetabelle verwendet werden sollen. Die Blöcke werden von Threads gelesen. Erhöhen Sie diesen Wert schrittweise, wenn Sie eine große Tabelle mit Millionen oder Milliarden von Zeilen haben und die Leistung optimieren. Größere Werte können die Leistung bei indizierten Tabellen erhöhen. Wenn der Wert jedoch zu groß ist, kann dies zu einer Thread-Verhungrung führen, da zu wenige Blöcke für die Threads vorhanden sind. Alias: blockSize. Standardwert: 1048576. Minimalwert: 0. Tipp: Sie können den Wert in Anführungszeichen setzen und B, K, M, G oder T als Suffix angeben, um die Einheiten anzuzeigen. Zum Beispiel gibt "8M" acht Megabyte an.
casout.timeStamp	Gibt an, eine Zeitstempelspalte zur Tabelle hinzuzufügen. Die Unterstützung für timeStamp ist aktionsspezifisch. Geben Sie den Wert in dem für Ihr Sitzungsgebietsschema geeigneten Format an.
table	Gibt die Tabelle an, für die der Index erstellt werden soll. Für weitere Informationen zur Angabe des Tabellenparameters siehe den gemeinsamen 'castable'-Parameter.
table.caslib	Gibt die Caslib an, in der die Tabelle gespeichert ist.
table.computedOnDemand	Gibt an, dass berechnete Spalten nur bei Bedarf berechnet werden sollen. Standardwert: FALSE.
table.computedVars	Gibt Informationen über Spalten an, die zur Tabelle hinzugefügt werden, wenn die Tabelle geladen wird. Die Werte für diese Spalten werden auf der Grundlage eines Programms berechnet. Die 'computedVars' Werte können einen oder mehrere der folgenden Werte enthalten: format, formattedLength, label, name (erforderlich), nfd, nfl.
table.computedVarsProgram	Gibt ein Programm an, das zur Berechnung von Werten für berechnete Spalten verwendet wird. Dieses Programm wird in derselben Syntax geschrieben, die in CASL-Ausdrücken verwendet wird.
table.dataSourceOptions	Gibt Optionen an, die für den Datenquellentyp spezifisch sind. Datenquellenoptionen werden verwendet, um eine Tabelle zu laden, die sich in einem Dateisystem befindet oder auf die über ein Datenbank- oder anderes Datenquellenzugriffsmodul zugegriffen wird.
table.groupBy	Gruppiert eine Tabelle nach Werten von Variablen. Es können ein oder mehrere gruppierte Variablen angegeben werden. Eine Gruppierung nach Variablen ermöglicht die Verarbeitung einer Tabelle in Abschnitten, in denen die Werte der Gruppierungsvariablen innerhalb jedes Abschnitts konstant sind. Wenn Sie eine Tabelle nach mehreren Variablen gruppieren, werden die Daten nach den Werten der ersten Variablen gruppiert, dann nach den Werten der zweiten Variablen innerhalb der ersten Variablen usw. Die 'groupBy' Werte können einen oder mehrere der folgenden Werte enthalten: format, formattedLength, label, name (erforderlich), nfd, nfl.
table.groupByMode	Gibt die Behandlungsweise für die gruppierten Werte in der Tabelle an. Standardwert: NOSORT. Werte: NOSORT \| REDISTRIBUTE.
table.importOptions	Gibt Optionen an, die zum Laden der Tabelle von der Datenquelle verwendet werden.
table.name	Gibt den Namen der Tabelle an.
table.orderBy	Sortiert eine Tabelle nach Werten von Variablen. Es können ein oder mehrere Sortiervariablen angegeben werden. Wenn Sie eine Tabelle nach mehreren Variablen sortieren, werden die Daten nach den Werten der ersten Variablen sortiert, dann nach den Werten der zweiten Variablen innerhalb der ersten Variablen usw. Die 'orderBy' Werte können einen oder mehrere der folgenden Werte enthalten: format, formattedLength, label, name (erforderlich), nfd, nfl.
table.singlePass	Wenn auf 'True' gesetzt, gibt diese Option an, dass die Tabelle nur einmal gelesen werden kann. Standardwert: FALSE.
table.vars	Gibt eine Liste von Spalten an, die von der Tabelle geladen werden sollen. Die 'vars' Werte können einen oder mehrere der folgenden Werte enthalten: format, formattedLength, label, name (erforderlich), nfd, nfl.
table.where	Gibt einen Unterausdruck an, der als Filter für die Tabelle verwendet wird.
table.whereTable	Gibt eine Tabelle an, die den 'where'-Ausdruck enthält. Die 'whereTable' Werte können einen oder mehrere der folgenden Werte enthalten: casLib, dataSourceOptions, importOptions, name (erforderlich), vars, where.

Datenaufbereitung Datenaufbereitungsblatt ansehen

Beispieldatenerstellung

Dieses Beispiel zeigt, wie eine einfache Tabelle in CAS erstellt wird.

Kopiert!

1	DATA casuser.iris;
2	SET sashelp.iris;
3	RUN;

Beispiele

Dieses Beispiel zeigt, wie Indizes für eine oder mehrere Spalten einer Tabelle in CAS erstellt werden.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	TABLE.index RESULT=r / TABLE={name='iris', caslib='casuser'}
3	casout={name='iris', caslib='casuser', indexVars={'species','sepalwidth'}};
4	QUIT;

Ergebnis :
Die Tabelle 'iris' in der Caslib 'casuser' hat nun Indizes für die Spalten 'species' und 'sepalwidth'.

Dieses Beispiel zeigt, wie eine bestehende SASHDAT-Datei indiziert wird, die bereits in einer Caslib vorhanden ist.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	TABLE.index RESULT=r / TABLE={name='cars', caslib='casuser'}
3	casout={name='cars', caslib='casuser', indexVars={'make','model'}};
4	QUIT;

Ergebnis :
Die SASHDAT-Datei 'cars' in der Caslib 'casuser' hat nun Indizes für die Spalten 'make' und 'model'.

FAQ

Was ist der Zweck der Index-Aktion?

Was sind die Einstellungen für eine Ausgabetabelle in der Index-Aktion?

Was ist 'caslib' im casout-Parameter?

Was bewirkt 'compress' im casout-Parameter?

Was ist 'indexVars' im casout-Parameter?

Was ist 'label' im casout-Parameter?

Was ist 'lifetime' im casout-Parameter?

Was ist 'maxMemSize' im casout-Parameter?

Was ist 'memoryFormat' im casout-Parameter?

Was bedeutet 'DVR' für 'memoryFormat'?

Was bedeutet 'INHERIT' für 'memoryFormat'?

Was bedeutet 'STANDARD' für 'memoryFormat'?

Was ist 'name' im casout-Parameter?

Was bewirkt 'promote' im casout-Parameter?

Was bewirkt 'replace' im casout-Parameter?

Was ist 'replication' im casout-Parameter?

Was ist 'tableRedistUpPolicy' im casout-Parameter?

Was bedeutet 'DEFER' für 'tableRedistUpPolicy'?

Was bedeutet 'NOREDIST' für 'tableRedistUpPolicy'?

Was bedeutet 'REBALANCE' für 'tableRedistUpPolicy'?

Was ist 'threadBlockSize' im casout-Parameter?

Was ist 'timeStamp' im casout-Parameter?

Was ist 'table' in der Index-Aktion?

Was ist 'caslib' im table-Parameter?

Was bewirkt 'computedOnDemand' im table-Parameter?

Was ist 'computedVars' im table-Parameter?

Was ist 'format' in computedVars?

Was ist 'formattedLength' in computedVars?

Was ist 'label' in computedVars?

Was ist 'name' in computedVars?

Was ist 'nfd' in computedVars?

Was ist 'nfl' in computedVars?

Was ist 'computedVarsProgram' im table-Parameter?

Was ist 'dataSourceOptions' im table-Parameter?

Was ist 'groupBy' im table-Parameter?

Was ist 'format' in groupBy?

Was ist 'formattedLength' in groupBy?

Was ist 'label' in groupBy?

Was ist 'name' in groupBy?

Was ist 'nfd' in groupBy?

Was ist 'nfl' in groupBy?

Was ist 'groupByMode' im table-Parameter?

Was sind 'importOptions' im table-Parameter?

Was ist 'name' im table-Parameter?

Was ist 'orderBy' im table-Parameter?

Was ist 'format' in orderBy?

Was ist 'formattedLength' in orderBy?

Was ist 'label' in orderBy?

Was ist 'name' in orderBy?

Was ist 'nfd' in orderBy?

Was ist 'nfl' in orderBy?

Was bewirkt 'singlePass' im table-Parameter?

Was ist 'vars' im table-Parameter?

Was ist 'format' in vars?

Was ist 'formattedLength' in vars?

Was ist 'label' in vars?

Was ist 'name' in vars?

Was ist 'nfd' in vars?

Was ist 'nfl' in vars?

Was ist 'where' im table-Parameter?

Was ist 'whereTable' im table-Parameter?

Was ist 'casLib' in whereTable?

Was ist 'dataSourceOptions' in whereTable?

Was sind 'importOptions' in whereTable?

Was ist 'name' in whereTable?

Was ist 'vars' in whereTable?

Was ist 'format' in vars (whereTable)?

Was ist 'formattedLength' in vars (whereTable)?

Was ist 'label' in vars (whereTable)?

Was ist 'name' in vars (whereTable)?

Was ist 'nfd' in vars (whereTable)?

Was ist 'nfl' in vars (whereTable)?

Was ist 'where' in whereTable?

Actions associées

table

addCaslibSubdir

Erstellt ein Unterverzeichnis in einer vorhandenen Caslib. Diese Aktion ist n...

table

addCaslib

Fügt eine neue Caslib hinzu, um den Zugriff auf eine Datenquelle zu ermöglich...

table

addTable

Fügt eine Tabelle hinzu, indem sie vom Client an den Server gesendet wird. Di...

table

alterTable

Die Aktion `alterTable` im `table` Action Set ist ein vielseitiges Werkzeug z...

table

append

Fügt die Zeilen einer Quelltabelle an eine Zieltabelle an. Diese Aktion ist n...

table

caslibInfo

Die Aktion `caslibInfo` ist ein grundlegendes Werkzeug zur Verwaltung von Clo...

Inhaltsverzeichnis

Data Engineering: Optimieren Sie I/O-Performance durch "In-Place" Modifikation (Indexing & Security Best Practices)

SAS Data Step I/O: Externe Dateien mit INFILE, FILE und Filerefs meistern

SAS-Performance optimieren: So nutzen Sie die Dataset-Option INDEX= effizient

Der ultimative SAS LIBNAME Guide: V9, SPDE, Hadoop & CAS meistern

Erstellung einer gruppierten Tabelle

Index erstellen

Variablen erstellen und Daten filtern mit DATA Step

Bezeichnungen und Formate anwenden

Modifikation von SAS-Datensätzen

Spalten in einer CAS-Tabelle indizieren

Beschreibung

Beispieldatenerstellung

Beispiele

Indizes für Spalten in einer Tabelle erstellen

Eine bestehende SASHDAT-Datei indizieren

FAQ

Actions associées

addCaslibSubdir

addCaslib

addTable

alterTable

append

caslibInfo