index - WeAreCAS

Q: ¿Cuál es el propósito de la acción "index"?

La acción "index" se utiliza para crear índices en una o más variables de tabla.

Q: ¿Dónde puedo encontrar más información sobre la indexación de tablas?

Puedes encontrar más información detallada sobre la indexación de tablas en la sección 'Indexing Tables' del documento.

Q: ¿Cómo puedo indexar columnas en una tabla?

Consulta el ejemplo 'Index Columns in a Table' para obtener instrucciones sobre cómo indexar columnas en una tabla.

Q: ¿Cómo puedo indexar un archivo SASHDAT existente?

Consulta el ejemplo 'Index an Existing SASHDAT File' para obtener instrucciones sobre cómo indexar un archivo SASHDAT existente.

Q: ¿Qué especifica el parámetro "casout" en la acción "index"?

El parámetro "casout" especifica la configuración de una tabla de salida. Su alias es 'outTable' y su forma abreviada es 'casout="nombre-de-tabla"'.

Q: ¿Qué especifica el subparámetro "caslib" dentro de "casout"?

El subparámetro "caslib" especifica el nombre de la caslib para la tabla de salida.

Q: ¿Qué hace el subparámetro "compress" dentro de "casout"?

Cuando se establece en 'True', aplica compresión de datos a la tabla. El valor predeterminado es 'FALSE'.

Q: ¿Qué especifica el subparámetro "indexVars" dentro de "casout"?

El subparámetro "indexVars" especifica la lista de variables para las cuales se crearán índices en los datos de salida.

Q: ¿Qué especifica el subparámetro "label" dentro de "casout"?

El subparámetro "label" especifica la etiqueta descriptiva que se asociará con la tabla.

Q: ¿Qué especifica el subparámetro "lifetime" dentro de "casout"?

El subparámetro "lifetime" especifica el número de segundos que la tabla permanecerá en memoria después de su último acceso. La tabla se elimina si no se accede a ella durante el número de segundos especificado. El valor predeterminado es 0 y el valor mínimo es 0.

Tabla de contenidos

Codes SAS Liés

Dominando PROC DATASETS: Cómo Modificar Tablas SAS sin Recrearlas

Lectura y escritura de archivos externos

Opción de conjunto de datos INDEX=

Uso de un motor SAS para procesar datos SAS

Ejemplos: Procesamiento WHERE

Creación de una tabla agrupada por

Creación de un índice

Creación de Variables y Filtrado de Datos con DATA Step

Sans titre

Modificación de conjuntos de datos SAS

Descripción

Crea índices en una o más variables de tabla. Para obtener más información sobre los parámetros, consulte la documentación original.

table.index <result=results> <status=rc> / casout={ caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string" }, table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={ casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | greenplum-parameters | hadoop-parameters | hana-parameters | hdfs-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | netezza-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression" } } ;

Parámetros

Parámetro	Descripción
casout	Especifica la configuración para una tabla de salida. El alias es 'outTable'.
casout.caslib	Especifica el nombre de la caslib para la tabla de salida.
casout.compress	Cuando se establece en True, aplica compresión de datos a la tabla. Por defecto es FALSE.
casout.indexVars	Especifica la lista de variables para las que se crearán índices en los datos de salida.
casout.label	Especifica la etiqueta descriptiva para asociar con la tabla.
casout.lifetime	Especifica el número de segundos que la tabla permanecerá en memoria después de su último acceso. La tabla se elimina si no se accede a ella durante el número de segundos especificado. El valor mínimo es 0, por defecto es 0.
casout.maxMemSize	Especifica la cantidad máxima de memoria, en bytes, que cada hilo debe asignar para bloques en memoria antes de convertir a un archivo mapeado en memoria. Los archivos se escriben en los directorios especificados en la variable de entorno CAS_DISK_CACHE. Sugerencia: Puede encerrar el valor entre comillas y especificar B, K, M, G o T como sufijo para indicar las unidades. Por ejemplo, "8M" especifica ocho megabytes.
casout.memoryFormat	Especifica el formato de memoria para la tabla de salida. Los valores posibles son 'DVR', 'INHERIT', 'STANDARD'. Por defecto es 'INHERIT'.
casout.memoryFormat.DVR	Utiliza el formato de memoria de reducción de valores duplicados. Este formato puede reducir el consumo de memoria y el tamaño del archivo cuando los datos de entrada contienen valores duplicados.
casout.memoryFormat.INHERIT	Utiliza el formato de memoria predeterminado configurado para el servidor. Por defecto, el servidor utiliza el formato de memoria estándar. Si un administrador establece la variable de entorno CAS_DEFAULT_MEMORY_FORMAT en DVR, el formato de memoria DVR se establece como predeterminado para el servidor.
casout.memoryFormat.STANDARD	Utiliza el formato de memoria estándar.
casout.name	Especifica el nombre para la tabla de salida.
casout.promote	Cuando se establece en True, añade la tabla de salida con un alcance global. Esto permite que otras sesiones accedan a la tabla, sujeto a los controles de acceso. La caslib de destino también debe tener un alcance global. Por defecto es FALSE.
casout.replace	Cuando se establece en True, sobrescribe una tabla existente que tenga el mismo nombre. Por defecto es FALSE.
casout.replication	Especifica el número de copias de la tabla a realizar para la tolerancia a fallos. Valores mayores resultan en un rendimiento más lento y usan más memoria, pero proporcionan alta disponibilidad para los datos en caso de fallo de un nodo. La redundancia de datos se aplica solo a servidores distribuidos. El valor mínimo es 0, por defecto es 1.
casout.tableRedistUpPolicy	Especifica la política de redistribución de la tabla cuando el número de pods de trabajo aumenta en un servidor CAS en ejecución.
casout.tableRedistUpPolicy.DEFER	Retrasar la selección de la política de redistribución a una entidad de nivel superior.
casout.tableRedistUpPolicy.NOREDIST	No redistribuir los datos de la tabla cuando el número de pods de trabajo cambia en un servidor CAS en ejecución.
casout.tableRedistUpPolicy.REBALANCE	Reequilibrar los datos de la tabla cuando el número de pods de trabajo cambia en un servidor CAS en ejecución.
casout.threadBlockSize	Especifica el número de bytes a usar para los bloques en la tabla de salida. Los bloques son leídos por los hilos. Aumente gradualmente este valor cuando tenga una tabla grande con millones o miles de millones de filas y esté optimizando el rendimiento. Valores más grandes pueden aumentar el rendimiento con tablas indexadas. Sin embargo, si el valor es demasiado grande, puede causar inanición de hilos debido a que hay muy pocos bloques para que los hilos trabajen. El alias es 'blockSize'. El valor mínimo es 0, por defecto es 1048576. Sugerencia: Puede encerrar el valor entre comillas y especificar B, K, M, G o T como sufijo para indicar las unidades. Por ejemplo, "8M" especifica ocho megabytes.
casout.timeStamp	Especifica que se añada una columna de marca de tiempo a la tabla. El soporte para timeStamp es específico de la acción. Especifique el valor en el formato apropiado para su configuración regional de sesión.
table	Especifica la tabla para la que se creará el índice. Es un parámetro requerido. Para más información sobre cómo especificar el parámetro de tabla, consulte el parámetro común castable.
table.caslib	Especifica la caslib de la tabla.
table.computedOnDemand	Especifica si las columnas calculadas en la tabla se calculan bajo demanda.
table.computedVars	Especifica una lista de variables calculadas para la tabla. Se requieren los subparámetros 'name'.
table.computedVars.format	Especifica el formato de la variable calculada.
table.computedVars.formattedLength	Especifica la longitud formateada de la variable calculada.
table.computedVars.label	Especifica la etiqueta de la variable calculada.
table.computedVars.name	Especifica el nombre de la variable calculada. Es un subparámetro requerido.
table.computedVars.nfd	Especifica el número de decimales para la variable calculada.
table.computedVars.nfl	Especifica la longitud de la variable calculada.
table.computedVarsProgram	Especifica un programa para calcular variables. Este programa se ejecuta en el servidor CAS para cada fila de la tabla.
table.dataSourceOptions	Especifica opciones específicas de la fuente de datos para la tabla.
table.groupBy	Especifica las variables por las que se agrupará la tabla. Se requieren los subparámetros 'name'.
table.groupBy.format	Especifica el formato de la variable de agrupación.
table.groupBy.formattedLength	Especifica la longitud formateada de la variable de agrupación.
table.groupBy.label	Especifica la etiqueta de la variable de agrupación.
table.groupBy.name	Especifica el nombre de la variable de agrupación. Es un subparámetro requerido.
table.groupBy.nfd	Especifica el número de decimales para la variable de agrupación.
table.groupBy.nfl	Especifica la longitud de la variable de agrupación.
table.groupByMode	Especifica el modo de agrupación. Los valores posibles son 'NOSORT' y 'REDISTRIBUTE'.
table.importOptions	Especifica opciones para importar datos a la tabla.
table.name	Especifica el nombre de la tabla. Es un parámetro requerido.
table.orderBy	Especifica las variables por las que se ordenará la tabla. Se requieren los subparámetros 'name'.
table.orderBy.format	Especifica el formato de la variable de ordenación.
table.orderBy.formattedLength	Especifica la longitud formateada de la variable de ordenación.
table.orderBy.label	Especifica la etiqueta de la variable de ordenación.
table.orderBy.name	Especifica el nombre de la variable de ordenación. Es un subparámetro requerido.
table.orderBy.nfd	Especifica el número de decimales para la variable de ordenación.
table.orderBy.nfl	Especifica la longitud de la variable de ordenación.
table.singlePass	Especifica si la tabla se procesa en una sola pasada.
table.vars	Especifica las variables a incluir en la tabla. Se requieren los subparámetros 'name'.
table.vars.format	Especifica el formato de la variable.
table.vars.formattedLength	Especifica la longitud formateada de la variable.
table.vars.label	Especifica la etiqueta de la variable.
table.vars.name	Especifica el nombre de la variable. Es un subparámetro requerido.
table.vars.nfd	Especifica el número de decimales para la variable.
table.vars.nfl	Especifica la longitud de la variable.
table.where	Especifica una expresión WHERE para filtrar las filas de la tabla.
table.whereTable	Especifica una tabla WHERE para filtrar las filas de la tabla.
table.whereTable.casLib	Especifica la caslib de la tabla WHERE.
table.whereTable.dataSourceOptions	Especifica opciones específicas de la fuente de datos para la tabla WHERE.
table.whereTable.importOptions	Especifica opciones para importar datos a la tabla WHERE.
table.whereTable.name	Especifica el nombre de la tabla WHERE. Es un subparámetro requerido.
table.whereTable.vars	Especifica las variables a incluir en la tabla WHERE. Se requieren los subparámetros 'name'.
table.whereTable.vars.format	Especifica el formato de la variable.
table.whereTable.vars.formattedLength	Especifica la longitud formateada de la variable.
table.whereTable.vars.label	Especifica la etiqueta de la variable.
table.whereTable.vars.name	Especifica el nombre de la variable. Es un subparámetro requerido.
table.whereTable.vars.nfd	Especifica el número de decimales para la variable.
table.whereTable.vars.nfl	Especifica la longitud de la variable.
table.whereTable.where	Especifica una expresión WHERE para filtrar las filas de la tabla WHERE.

Preparación de datos Ver hoja de preparación de datos

Creación de datos para ejemplos

Los siguientes programas de DATA step crean las tablas en memoria que se utilizan en los ejemplos. También puede ejecutar los ejemplos si las tablas ya existen en su caslib de sesión.

¡Copiado!

1	DATA casuser.iris;
2	SET sashelp.iris;
3	RUN;
4
5	DATA casuser.cars;
6	SET sashelp.cars;
7	RUN;

Ejemplos

Este ejemplo muestra cómo crear índices en columnas de una tabla CAS existente.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	cas.TABLE.index(s, TABLE='iris', casout=list(name='iris', caslib='casuser', indexVars=list('Species', 'SepalLength')))

Resultado :
Se crean índices en las columnas 'Species' y 'SepalLength' de la tabla 'iris'.

Este ejemplo muestra cómo crear índices en un archivo SASHDAT existente. Primero, se carga el archivo SASHDAT en memoria.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	cas.TABLE.loadtable(s, path='cars.sashdat', caslib='public', promote=TRUE)
2	cas.TABLE.index(s, TABLE='cars', casout=list(name='cars', caslib='casuser', indexVars=list('Origin', 'DriveTrain')))

Resultado :
Se carga el archivo 'cars.sashdat' en la caslib 'public' y se crean índices en las columnas 'Origin' y 'DriveTrain' de la tabla 'cars'.

FAQ

¿Cuál es el propósito de la acción "index"?

¿Dónde puedo encontrar más información sobre la indexación de tablas?

¿Cómo puedo indexar columnas en una tabla?

¿Cómo puedo indexar un archivo SASHDAT existente?

¿Qué especifica el parámetro "casout" en la acción "index"?

¿Qué especifica el subparámetro "caslib" dentro de "casout"?

¿Qué hace el subparámetro "compress" dentro de "casout"?

¿Qué especifica el subparámetro "indexVars" dentro de "casout"?

¿Qué especifica el subparámetro "label" dentro de "casout"?

¿Qué especifica el subparámetro "lifetime" dentro de "casout"?

¿Qué especifica el subparámetro "maxMemSize" dentro de "casout"?

¿Qué especifica el subparámetro "memoryFormat" dentro de "casout"?

¿Qué especifica el subparámetro "name" dentro de "casout"?

¿Qué hace el subparámetro "promote" dentro de "casout"?

¿Qué hace el subparámetro "replace" dentro de "casout"?

¿Qué especifica el subparámetro "replication" dentro de "casout"?

¿Qué especifica el subparámetro "tableRedistUpPolicy" dentro de "casout"?

¿Qué especifica el subparámetro "threadBlockSize" dentro de "casout"?

¿Qué especifica el subparámetro "timeStamp" dentro de "casout"?

¿Qué especifica el parámetro "table" en la acción "index"?

Actions associées

table

addCaslibSubdir

La acción `addCaslibSubdir` se utiliza para crear un nuevo subdirectorio dent...

table

addCaslib

La acción `addCaslib` es fundamental en SAS Viya, ya que permite definir una ...

table

addTable

La acción `addTable` se utiliza para crear una tabla en memoria en el servido...

table

alterTable

La acción `alterTable` del conjunto de acciones `table` en SAS Viya permite m...

table

append

La acción 'append' se utiliza para añadir las filas de una tabla de origen (s...

table

attribute

La acción `attribute` del conjunto de acciones `table` se utiliza para gestio...

Tabla de contenidos

Dominando PROC DATASETS: Cómo Modificar Tablas SAS sin Recrearlas

Lectura y escritura de archivos externos

Opción de conjunto de datos INDEX=

Uso de un motor SAS para procesar datos SAS

Ejemplos: Procesamiento WHERE

Creación de una tabla agrupada por

Creación de un índice

Creación de Variables y Filtrado de Datos con DATA Step

Sans titre

Modificación de conjuntos de datos SAS

Descripción

Creación de datos para ejemplos

Ejemplos

Indexar columnas en una tabla

Indexar un archivo SASHDAT existente

FAQ

Actions associées

addCaslibSubdir

addCaslib

addTable

alterTable

append

attribute