simple

groupBy

Descripción

Construye grupos BY en términos de las combinaciones de valores de las variables dadas en la lista de variables. Esta acción proporciona funciones analíticas básicas para el procesamiento de datos en SAS Cloud Analytic Services (CAS).

simple.groupBy <result=results> <status=rc> /\n aggregator="MAX" | "MEAN" | "MIN" | "N" | "SUM",\n attributes={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}},\n casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}},\n descending=TRUE | FALSE,\n freq="variable-name",\n includeMissing=TRUE | FALSE,\n inputs={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}},\n partition=TRUE | FALSE,\n repeatedTable=TRUE | FALSE,\n resultLimit=integer,\n scoreGt=double,\n scoreLt=double,\n table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}},\n weight="variable-name";
Parámetros
ParámetroDescripción
aggregator Especifica el agregador para el cual los valores de la variable de ponderación se agrupan en una puntuación de orden de clasificación si se especifica una variable de ponderación. Por defecto es SUM.
MAX Especifica el valor máximo.
MEAN Especifica la media aritmética.
MIN Especifica el valor mínimo.
N Especifica el número de observaciones.
SUM Especifica la suma de los valores no perdidos.
attributes Especifica los atributos de la variable. Para obtener más información sobre cómo especificar el parámetro de atributos, consulte el parámetro común casinvardesc.
casOut Especifica la configuración para una tabla de salida. Para obtener más información sobre cómo especificar el parámetro casOut, consulte el parámetro común casouttable.
descending Cuando se establece en True, los niveles de las variables de agrupación se organizan en orden descendente. Por defecto es FALSE.
freq Especifica la variable de frecuencia numérica utilizada para calcular la clasificación de una agrupación distinta.
includeMissing Cuando se establece en True, los valores perdidos se incluyen en la determinación de valores distintos en el análisis de agrupación. Por defecto es TRUE.
inputs Especifica las variables de entrada para el análisis. Para obtener más información sobre cómo especificar el parámetro de entradas, consulte el parámetro común casinvardesc.
partition Cuando se establece en True, se supone que la tabla está particionada. Por defecto es FALSE.
repeatedTable Cuando se establece en True, genera una tabla de agrupación repetida con las mismas filas en todos los nodos de trabajo. Por defecto es FALSE.
resultLimit Especifica el número máximo de agrupaciones distintas a devolver. El rango es 0 a MACINT.
scoreGt Especifica el límite inferior exclusivo de las puntuaciones de orden de clasificación numéricas de las agrupaciones distintas a devolver.
scoreLt Especifica el límite superior exclusivo de las puntuaciones de orden de clasificación numéricas de las agrupaciones distintas a devolver.
table Especifica el nombre de la tabla, la biblioteca CAS y otros parámetros comunes. Este es un parámetro requerido.
table.caslib Especifica la biblioteca CAS para la tabla de entrada que desea utilizar con la acción. De forma predeterminada, se utiliza la biblioteca CAS activa. Especifique un valor solo si necesita acceder a una tabla de una biblioteca CAS diferente.
table.computedOnDemand Cuando se establece en True, crea las variables calculadas cuando se carga la tabla en lugar de cuando comienza la acción. Por defecto es FALSE.
table.computedVars Especifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente.
table.computedVars.format Especifica el formato a aplicar a la variable.
table.computedVars.formattedLength Especifica la longitud del campo de formato más la longitud de la precisión del formato.
table.computedVars.label Especifica la etiqueta descriptiva para la variable.
table.computedVars.name Especifica el nombre de la variable. Este es un parámetro requerido.
table.computedVars.nfd Especifica la longitud de la precisión del formato.
table.computedVars.nfl Especifica la longitud del campo de formato.
table.computedVarsProgram Especifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
table.dataSourceOptions Especifica las opciones de la fuente de datos.
table.importOptions Especifica la configuración para leer una tabla de una fuente de datos. Para obtener más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions.
table.name Especifica el nombre de la tabla de entrada. Este es un parámetro requerido.
table.singlePass Cuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero es posible que los datos no tengan un orden estable en ejecuciones repetidas. Por defecto es FALSE.
table.vars Especifica las variables a utilizar en la acción.
table.vars.format Especifica el formato a aplicar a la variable.
table.vars.formattedLength Especifica la longitud del campo de formato más la longitud de la precisión del formato.
table.vars.label Especifica la etiqueta descriptiva para la variable.
table.vars.name Especifica el nombre de la variable. Este es un parámetro requerido.
table.vars.nfd Especifica la longitud de la precisión del formato.
table.vars.nfl Especifica la longitud del campo de formato.
table.where Especifica una expresión para subconjuntar los datos de entrada.
table.whereTable Especifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se utilizan todos los nombres de variable que son comunes a la tabla de entrada y a la tabla de filtrado para encontrar las filas coincidentes. Si se especifica el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero.
table.whereTable.casLib Especifica la biblioteca CAS para la tabla de filtro. De forma predeterminada, se utiliza la biblioteca CAS activa.
table.whereTable.dataSourceOptions Especifica las opciones de la fuente de datos.
table.whereTable.importOptions Especifica la configuración para leer una tabla de una fuente de datos. Para obtener más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions.
table.whereTable.name Especifica el nombre de la tabla de filtro. Este es un parámetro requerido.
table.whereTable.vars Especifica los nombres de las variables a utilizar de la tabla de filtro.
table.whereTable.vars.format Especifica el formato a aplicar a la variable.
table.whereTable.vars.formattedLength Especifica la longitud del campo de formato más la longitud de la precisión del formato.
table.whereTable.vars.label Especifica la etiqueta descriptiva para la variable.
table.whereTable.vars.name Especifica el nombre de la variable. Este es un parámetro requerido.
table.whereTable.vars.nfd Especifica la longitud de la precisión del formato.
table.whereTable.vars.nfl Especifica la longitud del campo de formato.
table.whereTable.where Especifica una expresión para subconjuntar los datos de la tabla de filtro.
weight Especifica la variable de ponderación numérica utilizada para calcular la puntuación de orden de clasificación de una agrupación distinta.

Ejemplos

FAQ

¿Qué es el agregador ("aggregator") y cuáles son sus opciones?
¿Qué son los atributos ("attributes")?
¿Qué es "casOut"?
¿Qué significa "descending"?
¿Qué es "freq"?
¿Qué significa "includeMissing"?
¿Qué son las entradas ("inputs")?
¿Qué significa "partition"?
¿Qué significa "repeatedTable"?
¿Qué es "resultLimit"?
¿Qué es "scoreGt"?
¿Qué es "scoreLt"?
¿Qué es la tabla ("table")?
¿Qué es "weight"?