simple

groupByInfo

Descripción

Calcula el índice y la frecuencia de cada grupo, y el índice de cada registro dentro de su grupo.

simple.groupByInfo <result=results> <status=rc> / <algorithm2=TRUE | FALSE>, <attributes={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}>, <casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2">}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"(string-1)" <, "(string-2)">}}>, <copyVars={"variable-name-1" <, "variable-name-2">}>, <cumFreqName="variable-name">, <details=TRUE | FALSE>, <divider="string">, <frequencyName="variable-name">, <generatedColumns={"ALL", "CUMFREQ", "F", "FREQUENCY", "GROUPID", "NONE", "POSITION"}>, <groupByLimit=64-bit-integer>, <groupbyTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, where="where-expression"}>, <groupIDName="variable-name">, <includeDuplicates=TRUE | FALSE>, <includeMissing=TRUE | FALSE>, <inputRegEx={"(string-1)" <, "(string-2)">}>, <inputs={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}>, <journalTrace=TRUE | FALSE>, <keyModify={"(string-1)" <, "(string-2)">}>, <maxFrequency=64-bit-integer>, <maxPosition=64-bit-integer>, <minFrequency=64-bit-integer>, <minGroupsLL=64-bit-integer>, <minPosition=64-bit-integer>, <noVars=TRUE | FALSE>, <nSubGroupVars=integer>, <position=64-bit-integer>, <positionName="variable-name">, <sparse=TRUE | FALSE>, <subGroupCumFreqName="variable-name">, <subGroupFrequencyName="variable-name">, <subGroupIDName="variable-name">, <subGroupPositionName="variable-name">, <table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, orderBy={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, vars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, where="where-expression"}}*;
Parámetros
ParámetroDescripción
cumFreqName Especifica el nombre de la columna para la frecuencia acumulada en la tabla de salida. La columna muestra la frecuencia acumulada del grupo al que pertenece el registro, con respecto a la tabla de entrada. El nombre de columna predeterminado es _CumFreq_. Alias: cumFrequencyName
frequencyName Especifica el nombre de la columna para las frecuencias de grupo en la tabla de salida. El nombre de columna predeterminado es _Frequency_. Alias: freqName
generatedColumns Especifica las columnas generadas que se incluirán en la tabla de salida. Alias: genCols Requisito: Los valores especificados deben ser únicos. ALL: Especifica que se incluyan todas las columnas generadas en la tabla de salida. CUMFREQ: Especifica que se incluya la columna _CumFreq_ en la tabla de salida. Si se especifica el parámetro nSubGroupVars, también se incluye la columna _SubCumFreq_. F: Especifica que se incluyan las columnas que contienen valores formateados de las variables de groupBy en la tabla de salida. Estas son las columnas con nombres que terminan en _F. FREQUENCY: Especifica que se incluya la columna _Frequency_ en la tabla de salida. GROUPID: Especifica que se incluya la columna _GroupID_ en la tabla de salida. NONE: Especifica que no se incluya ninguna columna generada en la tabla de salida. POSITION: Especifica que se incluya la columna _Position_ en la tabla de salida.
groupIDName Especifica el nombre de la columna para los ID de grupo en la tabla de salida. El nombre de columna predeterminado es _GroupID_.
positionName Especifica el nombre de la columna para la posición del registro dentro de su grupo en la tabla de salida. El nombre de columna predeterminado es _Position_.
subGroupCumFreqName Especifica el nombre de la columna para la frecuencia acumulada de los subgrupos a los que pertenece cada registro. El nombre de columna predeterminado es _SubCumFreq_. Aliases: subGroupCumFrequencyName, subCumFreqName, subCumFrequencyName
subGroupFrequencyName Especifica el nombre de la columna para la frecuencia del registro dentro de su subgrupo. El nombre de columna predeterminado es _SubFrequency_. Aliases: subGroupFreqName, subFrequencyName, subFreqName
subGroupIDName Especifica el nombre de la columna para los ID de subgrupo. El nombre de columna predeterminado es _SubGroupID_.
subGroupPositionName Especifica el nombre de la columna para las frecuencias de subgrupo. El nombre de columna predeterminado es _SubPosition_. Alias: subPositionName
algorithm2 Especifica un algoritmo más eficiente para procesar la información del grupo. El procesamiento con este algoritmo podría ser más rápido cuando los datos contienen un gran número de grupos y la cuadrícula que se está utilizando tiene muchos nodos. Predeterminado: False Interacción: Cuando se especifica True, se ignoran los siguientes parámetros: divider=, includeMissing=, inputRegex=, keyModify=, nSubgroupVars=, subgroupCumFreqName=, subgroupFrequencyName=, subgroupIdName=, y subgroupPositionName=. Nota: Cuando se especifica True, la tabla de salida especificada por casOut= no contiene columnas de valores formateados para las variables de entrada (columnas <nombre-variable-entrada>_F).
details Especifica que los mensajes, como el número de grupos y otros detalles, se escriben en el registro SAS. Predeterminado: FALSE
divider Especifica el carácter que se utiliza para dividir los valores de caracteres de las variables de entrada. Especifique un carácter que no esté en estas variables.
groupByLimit Especifica el número máximo de niveles en un conjunto de agrupación. Cuando el servidor determina este número de niveles, el servidor se detiene y no devuelve un resultado. Especifique este parámetro si desea evitar la creación de grandes conjuntos de resultados en las operaciones de agrupación. Valor mínimo: 1
includeDuplicates Especifica que la tabla de salida contiene registros duplicados. Aliases: includeDups, includeDup, fullOutput Predeterminado: FALSE
includeMissing Especifica que los grupos que tienen un valor faltante en una variable de groupBy se incluyen en la tabla casOut. Predeterminado: FALSE
inputRegEx Especifica una lista de expresiones regulares, una para cada variable en la lista de entradas.
journalTrace Cuando se establece en True, la acción escribe información de rastreo detallada en el registro SAS. Predeterminado: FALSE
keyModify Especifica si desea que los valores de caracteres en las variables de entrada se justifiquen a la izquierda (L), a la derecha (R), se conviertan a mayúsculas (U) y los espacios en blanco consecutivos se condensen a un solo espacio en blanco (C).
maxFrequency Especifica que la tabla de salida contiene registros con _Frequency_ menor o igual a este número. Alias: maxFreq Predeterminado: INT64_MAX Valor mínimo: 1
maxPosition Especifica que la tabla de salida contiene registros con _Position_ menor o igual a este número. Alias: maxIIG Predeterminado: INT64_MAX Valor mínimo: 1
minFrequency Especifica que la tabla de salida contiene registros con _Frequency_ mayor o igual a este número. Alias: minFreq Predeterminado: 0 Valor mínimo: 1
minGroupsLL Especifica el número mínimo de grupos que se requieren para usar algoritmos paralelos de poslectura. Predeterminado: 100000 Valor mínimo: 1
minPosition Especifica que la tabla de salida contiene registros con _Position_ mayor o igual a este número. Alias: minPos Predeterminado: -1 Valor mínimo: 1
noVars Cuando se establece en True, no se copian automáticamente variables de la tabla de entrada a la tabla de salida. Por defecto, se copian todas las columnas que no están en los parámetros de entrada, groupBy, weight o frequency. Predeterminado: FALSE
nSubGroupVars Especifica el número de variables en la lista de variables de entrada cuyos valores determinan los subgrupos. Aliases: nSubGroupVariables, nSubGroupCols, nSubGroupColumns Predeterminado: 0 Valor mínimo: 1
position Especifica que se filtren los registros para la tabla de salida. Solo los registros que coinciden con el valor especificado en la columna _Position_ se incluyen en la tabla de salida. Predeterminado: -1 Valor mínimo: 1
sparse Cuando se establece en True y la acción se ejecuta en un servidor distribuido, cada hilo lee datos que pertenecen solo a unos pocos grupos. Por defecto, cada hilo lee registros de muchos o todos los grupos. Especifique True para mejorar el rendimiento cuando hay muchos hilos en todos los workers, muchos grupos o ambos. En algunos casos, sparse se habilita automáticamente. Predeterminado: FALSE
attributes Especifica los atributos de la variable.
casOut Especifica la configuración de una tabla de salida.
copyVars Especifica las columnas a copiar de la tabla de entrada a la tabla de salida casOut. Las variables especificadas en el parámetro inputs y las columnas groupBy se copian automáticamente. Aliases: copyVar, extraVars
groupbyTable Especifica una tabla de entrada que contiene los grupos a usar en un análisis de agrupación. Caslib: Especifica la caslib para la tabla de filtro. Por defecto, se utiliza la caslib activa. DataSourceOptions: Especifica las opciones de la fuente de datos. ImportOptions: Especifica la configuración para leer una tabla de una fuente de datos. Name: Especifica el nombre de la tabla de filtro. Where: Especifica una expresión para subconjuntar los datos de la tabla de filtro.
inputs Especifica las variables de entrada para el análisis.
table Especifica el nombre de la tabla, la caslib y otros parámetros comunes.

Ejemplos