groupByInfo - WeAreCAS

Tabla de contenidos

Descripción

Calcula el índice y la frecuencia de cada grupo, y el índice de cada registro dentro de su grupo.

simple.groupByInfo <result=results> <status=rc> / <algorithm2=TRUE | FALSE>, <attributes={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}>, <casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2">}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"(string-1)" <, "(string-2)">}}>, <copyVars={"variable-name-1" <, "variable-name-2">}>, <cumFreqName="variable-name">, <details=TRUE | FALSE>, <divider="string">, <frequencyName="variable-name">, <generatedColumns={"ALL", "CUMFREQ", "F", "FREQUENCY", "GROUPID", "NONE", "POSITION"}>, <groupByLimit=64-bit-integer>, <groupbyTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, where="where-expression"}>, <groupIDName="variable-name">, <includeDuplicates=TRUE | FALSE>, <includeMissing=TRUE | FALSE>, <inputRegEx={"(string-1)" <, "(string-2)">}>, <inputs={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}>, <journalTrace=TRUE | FALSE>, <keyModify={"(string-1)" <, "(string-2)">}>, <maxFrequency=64-bit-integer>, <maxPosition=64-bit-integer>, <minFrequency=64-bit-integer>, <minGroupsLL=64-bit-integer>, <minPosition=64-bit-integer>, <noVars=TRUE | FALSE>, <nSubGroupVars=integer>, <position=64-bit-integer>, <positionName="variable-name">, <sparse=TRUE | FALSE>, <subGroupCumFreqName="variable-name">, <subGroupFrequencyName="variable-name">, <subGroupIDName="variable-name">, <subGroupPositionName="variable-name">, <table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, orderBy={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, vars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, where="where-expression"}}*;

Parámetros

Parámetro	Descripción
cumFreqName	Especifica el nombre de la columna para la frecuencia acumulada en la tabla de salida. La columna muestra la frecuencia acumulada del grupo al que pertenece el registro, con respecto a la tabla de entrada. El nombre de columna predeterminado es _CumFreq_. Alias: cumFrequencyName
frequencyName	Especifica el nombre de la columna para las frecuencias de grupo en la tabla de salida. El nombre de columna predeterminado es _Frequency_. Alias: freqName
generatedColumns	Especifica las columnas generadas que se incluirán en la tabla de salida. Alias: genCols Requisito: Los valores especificados deben ser únicos. ALL: Especifica que se incluyan todas las columnas generadas en la tabla de salida. CUMFREQ: Especifica que se incluya la columna _CumFreq_ en la tabla de salida. Si se especifica el parámetro nSubGroupVars, también se incluye la columna _SubCumFreq_. F: Especifica que se incluyan las columnas que contienen valores formateados de las variables de groupBy en la tabla de salida. Estas son las columnas con nombres que terminan en _F. FREQUENCY: Especifica que se incluya la columna _Frequency_ en la tabla de salida. GROUPID: Especifica que se incluya la columna _GroupID_ en la tabla de salida. NONE: Especifica que no se incluya ninguna columna generada en la tabla de salida. POSITION: Especifica que se incluya la columna _Position_ en la tabla de salida.
groupIDName	Especifica el nombre de la columna para los ID de grupo en la tabla de salida. El nombre de columna predeterminado es _GroupID_.
positionName	Especifica el nombre de la columna para la posición del registro dentro de su grupo en la tabla de salida. El nombre de columna predeterminado es _Position_.
subGroupCumFreqName	Especifica el nombre de la columna para la frecuencia acumulada de los subgrupos a los que pertenece cada registro. El nombre de columna predeterminado es _SubCumFreq_. Aliases: subGroupCumFrequencyName, subCumFreqName, subCumFrequencyName
subGroupFrequencyName	Especifica el nombre de la columna para la frecuencia del registro dentro de su subgrupo. El nombre de columna predeterminado es _SubFrequency_. Aliases: subGroupFreqName, subFrequencyName, subFreqName
subGroupIDName	Especifica el nombre de la columna para los ID de subgrupo. El nombre de columna predeterminado es _SubGroupID_.
subGroupPositionName	Especifica el nombre de la columna para las frecuencias de subgrupo. El nombre de columna predeterminado es _SubPosition_. Alias: subPositionName
algorithm2	Especifica un algoritmo más eficiente para procesar la información del grupo. El procesamiento con este algoritmo podría ser más rápido cuando los datos contienen un gran número de grupos y la cuadrícula que se está utilizando tiene muchos nodos. Predeterminado: False Interacción: Cuando se especifica True, se ignoran los siguientes parámetros: divider=, includeMissing=, inputRegex=, keyModify=, nSubgroupVars=, subgroupCumFreqName=, subgroupFrequencyName=, subgroupIdName=, y subgroupPositionName=. Nota: Cuando se especifica True, la tabla de salida especificada por casOut= no contiene columnas de valores formateados para las variables de entrada (columnas <nombre-variable-entrada>_F).
details	Especifica que los mensajes, como el número de grupos y otros detalles, se escriben en el registro SAS. Predeterminado: FALSE
divider	Especifica el carácter que se utiliza para dividir los valores de caracteres de las variables de entrada. Especifique un carácter que no esté en estas variables.
groupByLimit	Especifica el número máximo de niveles en un conjunto de agrupación. Cuando el servidor determina este número de niveles, el servidor se detiene y no devuelve un resultado. Especifique este parámetro si desea evitar la creación de grandes conjuntos de resultados en las operaciones de agrupación. Valor mínimo: 1
includeDuplicates	Especifica que la tabla de salida contiene registros duplicados. Aliases: includeDups, includeDup, fullOutput Predeterminado: FALSE
includeMissing	Especifica que los grupos que tienen un valor faltante en una variable de groupBy se incluyen en la tabla casOut. Predeterminado: FALSE
inputRegEx	Especifica una lista de expresiones regulares, una para cada variable en la lista de entradas.
journalTrace	Cuando se establece en True, la acción escribe información de rastreo detallada en el registro SAS. Predeterminado: FALSE
keyModify	Especifica si desea que los valores de caracteres en las variables de entrada se justifiquen a la izquierda (L), a la derecha (R), se conviertan a mayúsculas (U) y los espacios en blanco consecutivos se condensen a un solo espacio en blanco (C).
maxFrequency	Especifica que la tabla de salida contiene registros con _Frequency_ menor o igual a este número. Alias: maxFreq Predeterminado: INT64_MAX Valor mínimo: 1
maxPosition	Especifica que la tabla de salida contiene registros con _Position_ menor o igual a este número. Alias: maxIIG Predeterminado: INT64_MAX Valor mínimo: 1
minFrequency	Especifica que la tabla de salida contiene registros con _Frequency_ mayor o igual a este número. Alias: minFreq Predeterminado: 0 Valor mínimo: 1
minGroupsLL	Especifica el número mínimo de grupos que se requieren para usar algoritmos paralelos de poslectura. Predeterminado: 100000 Valor mínimo: 1
minPosition	Especifica que la tabla de salida contiene registros con _Position_ mayor o igual a este número. Alias: minPos Predeterminado: -1 Valor mínimo: 1
noVars	Cuando se establece en True, no se copian automáticamente variables de la tabla de entrada a la tabla de salida. Por defecto, se copian todas las columnas que no están en los parámetros de entrada, groupBy, weight o frequency. Predeterminado: FALSE
nSubGroupVars	Especifica el número de variables en la lista de variables de entrada cuyos valores determinan los subgrupos. Aliases: nSubGroupVariables, nSubGroupCols, nSubGroupColumns Predeterminado: 0 Valor mínimo: 1
position	Especifica que se filtren los registros para la tabla de salida. Solo los registros que coinciden con el valor especificado en la columna _Position_ se incluyen en la tabla de salida. Predeterminado: -1 Valor mínimo: 1
sparse	Cuando se establece en True y la acción se ejecuta en un servidor distribuido, cada hilo lee datos que pertenecen solo a unos pocos grupos. Por defecto, cada hilo lee registros de muchos o todos los grupos. Especifique True para mejorar el rendimiento cuando hay muchos hilos en todos los workers, muchos grupos o ambos. En algunos casos, sparse se habilita automáticamente. Predeterminado: FALSE
attributes	Especifica los atributos de la variable.
casOut	Especifica la configuración de una tabla de salida.
copyVars	Especifica las columnas a copiar de la tabla de entrada a la tabla de salida casOut. Las variables especificadas en el parámetro inputs y las columnas groupBy se copian automáticamente. Aliases: copyVar, extraVars
groupbyTable	Especifica una tabla de entrada que contiene los grupos a usar en un análisis de agrupación. Caslib: Especifica la caslib para la tabla de filtro. Por defecto, se utiliza la caslib activa. DataSourceOptions: Especifica las opciones de la fuente de datos. ImportOptions: Especifica la configuración para leer una tabla de una fuente de datos. Name: Especifica el nombre de la tabla de filtro. Where: Especifica una expresión para subconjuntar los datos de la tabla de filtro.
inputs	Especifica las variables de entrada para el análisis.
table	Especifica el nombre de la tabla, la caslib y otros parámetros comunes.

Ejemplos

Actions associées

simple

compare

Compara dos tablas calculando el índice y la frecuencia de cada grupo, la fre...

simple

correlation

Calcula las correlaciones del producto-momento de Pearson. Esta acción es fun...

simple

crossTab

La acción `crossTab` del conjunto de acciones `simple` se utiliza para realiz...

simple

freq

Genera una distribución de frecuencia para una o más variables. Esta acción e...

simple

groupBy

Construye grupos BY en términos de las combinaciones de valores de las variab...

simple

mdSummary

Calcula resúmenes multidimensionales de variables numéricas.