simple

groupBy

Descripción

Construye grupos BY en términos de las combinaciones de valores de las variables dadas en la lista de variables. Esta acción proporciona funciones analíticas básicas para el procesamiento de datos en SAS Cloud Analytic Services (CAS).

simple.groupBy <result=results> <status=rc> /\n aggregator="MAX" | "MEAN" | "MIN" | "N" | "SUM",\n attributes={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}},\n casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}},\n descending=TRUE | FALSE,\n freq="variable-name",\n includeMissing=TRUE | FALSE,\n inputs={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}},\n partition=TRUE | FALSE,\n repeatedTable=TRUE | FALSE,\n resultLimit=integer,\n scoreGt=double,\n scoreLt=double,\n table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}},\n weight="variable-name";
Parámetros
ParámetroDescripción
aggregatorEspecifica el agregador para el cual los valores de la variable de ponderación se agrupan en una puntuación de orden de clasificación si se especifica una variable de ponderación. Por defecto es SUM.
MAXEspecifica el valor máximo.
MEANEspecifica la media aritmética.
MINEspecifica el valor mínimo.
NEspecifica el número de observaciones.
SUMEspecifica la suma de los valores no perdidos.
attributesEspecifica los atributos de la variable. Para obtener más información sobre cómo especificar el parámetro de atributos, consulte el parámetro común casinvardesc.
casOutEspecifica la configuración para una tabla de salida. Para obtener más información sobre cómo especificar el parámetro casOut, consulte el parámetro común casouttable.
descendingCuando se establece en True, los niveles de las variables de agrupación se organizan en orden descendente. Por defecto es FALSE.
freqEspecifica la variable de frecuencia numérica utilizada para calcular la clasificación de una agrupación distinta.
includeMissingCuando se establece en True, los valores perdidos se incluyen en la determinación de valores distintos en el análisis de agrupación. Por defecto es TRUE.
inputsEspecifica las variables de entrada para el análisis. Para obtener más información sobre cómo especificar el parámetro de entradas, consulte el parámetro común casinvardesc.
partitionCuando se establece en True, se supone que la tabla está particionada. Por defecto es FALSE.
repeatedTableCuando se establece en True, genera una tabla de agrupación repetida con las mismas filas en todos los nodos de trabajo. Por defecto es FALSE.
resultLimitEspecifica el número máximo de agrupaciones distintas a devolver. El rango es 0 a MACINT.
scoreGtEspecifica el límite inferior exclusivo de las puntuaciones de orden de clasificación numéricas de las agrupaciones distintas a devolver.
scoreLtEspecifica el límite superior exclusivo de las puntuaciones de orden de clasificación numéricas de las agrupaciones distintas a devolver.
tableEspecifica el nombre de la tabla, la biblioteca CAS y otros parámetros comunes. Este es un parámetro requerido.
table.caslibEspecifica la biblioteca CAS para la tabla de entrada que desea utilizar con la acción. De forma predeterminada, se utiliza la biblioteca CAS activa. Especifique un valor solo si necesita acceder a una tabla de una biblioteca CAS diferente.
table.computedOnDemandCuando se establece en True, crea las variables calculadas cuando se carga la tabla en lugar de cuando comienza la acción. Por defecto es FALSE.
table.computedVarsEspecifica los nombres de las variables calculadas a crear. Especifique una expresión para cada variable en el parámetro computedVarsProgram. Si no especifica este parámetro, todas las variables de computedVarsProgram se incluyen automáticamente.
table.computedVars.formatEspecifica el formato a aplicar a la variable.
table.computedVars.formattedLengthEspecifica la longitud del campo de formato más la longitud de la precisión del formato.
table.computedVars.labelEspecifica la etiqueta descriptiva para la variable.
table.computedVars.nameEspecifica el nombre de la variable. Este es un parámetro requerido.
table.computedVars.nfdEspecifica la longitud de la precisión del formato.
table.computedVars.nflEspecifica la longitud del campo de formato.
table.computedVarsProgramEspecifica una expresión para cada variable calculada que incluya en el parámetro computedVars.
table.dataSourceOptionsEspecifica las opciones de la fuente de datos.
table.importOptionsEspecifica la configuración para leer una tabla de una fuente de datos. Para obtener más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions.
table.nameEspecifica el nombre de la tabla de entrada. Este es un parámetro requerido.
table.singlePassCuando se establece en True, no crea una tabla transitoria en el servidor. Establecer este parámetro en True puede ser eficiente, pero es posible que los datos no tengan un orden estable en ejecuciones repetidas. Por defecto es FALSE.
table.varsEspecifica las variables a utilizar en la acción.
table.vars.formatEspecifica el formato a aplicar a la variable.
table.vars.formattedLengthEspecifica la longitud del campo de formato más la longitud de la precisión del formato.
table.vars.labelEspecifica la etiqueta descriptiva para la variable.
table.vars.nameEspecifica el nombre de la variable. Este es un parámetro requerido.
table.vars.nfdEspecifica la longitud de la precisión del formato.
table.vars.nflEspecifica la longitud del campo de formato.
table.whereEspecifica una expresión para subconjuntar los datos de entrada.
table.whereTableEspecifica una tabla de entrada que contiene filas para usar como filtro WHERE. Si el parámetro vars no se especifica, se utilizan todos los nombres de variable que son comunes a la tabla de entrada y a la tabla de filtrado para encontrar las filas coincidentes. Si se especifica el parámetro where para la tabla de entrada y este parámetro, esta tabla de filtrado se aplica primero.
table.whereTable.casLibEspecifica la biblioteca CAS para la tabla de filtro. De forma predeterminada, se utiliza la biblioteca CAS activa.
table.whereTable.dataSourceOptionsEspecifica las opciones de la fuente de datos.
table.whereTable.importOptionsEspecifica la configuración para leer una tabla de una fuente de datos. Para obtener más información sobre cómo especificar el parámetro importOptions, consulte el parámetro común importOptions.
table.whereTable.nameEspecifica el nombre de la tabla de filtro. Este es un parámetro requerido.
table.whereTable.varsEspecifica los nombres de las variables a utilizar de la tabla de filtro.
table.whereTable.vars.formatEspecifica el formato a aplicar a la variable.
table.whereTable.vars.formattedLengthEspecifica la longitud del campo de formato más la longitud de la precisión del formato.
table.whereTable.vars.labelEspecifica la etiqueta descriptiva para la variable.
table.whereTable.vars.nameEspecifica el nombre de la variable. Este es un parámetro requerido.
table.whereTable.vars.nfdEspecifica la longitud de la precisión del formato.
table.whereTable.vars.nflEspecifica la longitud del campo de formato.
table.whereTable.whereEspecifica una expresión para subconjuntar los datos de la tabla de filtro.
weightEspecifica la variable de ponderación numérica utilizada para calcular la puntuación de orden de clasificación de una agrupación distinta.

Ejemplos

FAQ

¿Qué es el agregador ("aggregator") y cuáles son sus opciones?
¿Qué son los atributos ("attributes")?
¿Qué es "casOut"?
¿Qué significa "descending"?
¿Qué es "freq"?
¿Qué significa "includeMissing"?
¿Qué son las entradas ("inputs")?
¿Qué significa "partition"?
¿Qué significa "repeatedTable"?
¿Qué es "resultLimit"?
¿Qué es "scoreGt"?
¿Qué es "scoreLt"?
¿Qué es la tabla ("table")?
¿Qué es "weight"?