simple

groupByInfo

Descripción

Calcula el índice y la frecuencia de cada grupo, y el índice de cada registro dentro de su grupo.

simple.groupByInfo <result=results> <status=rc> / <algorithm2=TRUE | FALSE>, <attributes={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}>, <casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2">}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"(string-1)" <, "(string-2)">}}>, <copyVars={"variable-name-1" <, "variable-name-2">}>, <cumFreqName="variable-name">, <details=TRUE | FALSE>, <divider="string">, <frequencyName="variable-name">, <generatedColumns={"ALL", "CUMFREQ", "F", "FREQUENCY", "GROUPID", "NONE", "POSITION"}>, <groupByLimit=64-bit-integer>, <groupbyTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, where="where-expression"}>, <groupIDName="variable-name">, <includeDuplicates=TRUE | FALSE>, <includeMissing=TRUE | FALSE>, <inputRegEx={"(string-1)" <, "(string-2)">}>, <inputs={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}>, <journalTrace=TRUE | FALSE>, <keyModify={"(string-1)" <, "(string-2)">}>, <maxFrequency=64-bit-integer>, <maxPosition=64-bit-integer>, <minFrequency=64-bit-integer>, <minGroupsLL=64-bit-integer>, <minPosition=64-bit-integer>, <noVars=TRUE | FALSE>, <nSubGroupVars=integer>, <position=64-bit-integer>, <positionName="variable-name">, <sparse=TRUE | FALSE>, <subGroupCumFreqName="variable-name">, <subGroupFrequencyName="variable-name">, <subGroupIDName="variable-name">, <subGroupPositionName="variable-name">, <table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, orderBy={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name"*, vars={{format="string", formattedLength=integer, label="string", name="variable-name"*, nfd=integer, nfl=integer}, {...}}, where="where-expression"}}*;
Parámetros
ParámetroDescripción
cumFreqNameEspecifica el nombre de la columna para la frecuencia acumulada en la tabla de salida. La columna muestra la frecuencia acumulada del grupo al que pertenece el registro, con respecto a la tabla de entrada. El nombre de columna predeterminado es _CumFreq_. Alias: cumFrequencyName
frequencyNameEspecifica el nombre de la columna para las frecuencias de grupo en la tabla de salida. El nombre de columna predeterminado es _Frequency_. Alias: freqName
generatedColumnsEspecifica las columnas generadas que se incluirán en la tabla de salida. Alias: genCols Requisito: Los valores especificados deben ser únicos. ALL: Especifica que se incluyan todas las columnas generadas en la tabla de salida. CUMFREQ: Especifica que se incluya la columna _CumFreq_ en la tabla de salida. Si se especifica el parámetro nSubGroupVars, también se incluye la columna _SubCumFreq_. F: Especifica que se incluyan las columnas que contienen valores formateados de las variables de groupBy en la tabla de salida. Estas son las columnas con nombres que terminan en _F. FREQUENCY: Especifica que se incluya la columna _Frequency_ en la tabla de salida. GROUPID: Especifica que se incluya la columna _GroupID_ en la tabla de salida. NONE: Especifica que no se incluya ninguna columna generada en la tabla de salida. POSITION: Especifica que se incluya la columna _Position_ en la tabla de salida.
groupIDNameEspecifica el nombre de la columna para los ID de grupo en la tabla de salida. El nombre de columna predeterminado es _GroupID_.
positionNameEspecifica el nombre de la columna para la posición del registro dentro de su grupo en la tabla de salida. El nombre de columna predeterminado es _Position_.
subGroupCumFreqNameEspecifica el nombre de la columna para la frecuencia acumulada de los subgrupos a los que pertenece cada registro. El nombre de columna predeterminado es _SubCumFreq_. Aliases: subGroupCumFrequencyName, subCumFreqName, subCumFrequencyName
subGroupFrequencyNameEspecifica el nombre de la columna para la frecuencia del registro dentro de su subgrupo. El nombre de columna predeterminado es _SubFrequency_. Aliases: subGroupFreqName, subFrequencyName, subFreqName
subGroupIDNameEspecifica el nombre de la columna para los ID de subgrupo. El nombre de columna predeterminado es _SubGroupID_.
subGroupPositionNameEspecifica el nombre de la columna para las frecuencias de subgrupo. El nombre de columna predeterminado es _SubPosition_. Alias: subPositionName
algorithm2Especifica un algoritmo más eficiente para procesar la información del grupo. El procesamiento con este algoritmo podría ser más rápido cuando los datos contienen un gran número de grupos y la cuadrícula que se está utilizando tiene muchos nodos. Predeterminado: False Interacción: Cuando se especifica True, se ignoran los siguientes parámetros: divider=, includeMissing=, inputRegex=, keyModify=, nSubgroupVars=, subgroupCumFreqName=, subgroupFrequencyName=, subgroupIdName=, y subgroupPositionName=. Nota: Cuando se especifica True, la tabla de salida especificada por casOut= no contiene columnas de valores formateados para las variables de entrada (columnas <nombre-variable-entrada>_F).
detailsEspecifica que los mensajes, como el número de grupos y otros detalles, se escriben en el registro SAS. Predeterminado: FALSE
dividerEspecifica el carácter que se utiliza para dividir los valores de caracteres de las variables de entrada. Especifique un carácter que no esté en estas variables.
groupByLimitEspecifica el número máximo de niveles en un conjunto de agrupación. Cuando el servidor determina este número de niveles, el servidor se detiene y no devuelve un resultado. Especifique este parámetro si desea evitar la creación de grandes conjuntos de resultados en las operaciones de agrupación. Valor mínimo: 1
includeDuplicatesEspecifica que la tabla de salida contiene registros duplicados. Aliases: includeDups, includeDup, fullOutput Predeterminado: FALSE
includeMissingEspecifica que los grupos que tienen un valor faltante en una variable de groupBy se incluyen en la tabla casOut. Predeterminado: FALSE
inputRegExEspecifica una lista de expresiones regulares, una para cada variable en la lista de entradas.
journalTraceCuando se establece en True, la acción escribe información de rastreo detallada en el registro SAS. Predeterminado: FALSE
keyModifyEspecifica si desea que los valores de caracteres en las variables de entrada se justifiquen a la izquierda (L), a la derecha (R), se conviertan a mayúsculas (U) y los espacios en blanco consecutivos se condensen a un solo espacio en blanco (C).
maxFrequencyEspecifica que la tabla de salida contiene registros con _Frequency_ menor o igual a este número. Alias: maxFreq Predeterminado: INT64_MAX Valor mínimo: 1
maxPositionEspecifica que la tabla de salida contiene registros con _Position_ menor o igual a este número. Alias: maxIIG Predeterminado: INT64_MAX Valor mínimo: 1
minFrequencyEspecifica que la tabla de salida contiene registros con _Frequency_ mayor o igual a este número. Alias: minFreq Predeterminado: 0 Valor mínimo: 1
minGroupsLLEspecifica el número mínimo de grupos que se requieren para usar algoritmos paralelos de poslectura. Predeterminado: 100000 Valor mínimo: 1
minPositionEspecifica que la tabla de salida contiene registros con _Position_ mayor o igual a este número. Alias: minPos Predeterminado: -1 Valor mínimo: 1
noVarsCuando se establece en True, no se copian automáticamente variables de la tabla de entrada a la tabla de salida. Por defecto, se copian todas las columnas que no están en los parámetros de entrada, groupBy, weight o frequency. Predeterminado: FALSE
nSubGroupVarsEspecifica el número de variables en la lista de variables de entrada cuyos valores determinan los subgrupos. Aliases: nSubGroupVariables, nSubGroupCols, nSubGroupColumns Predeterminado: 0 Valor mínimo: 1
positionEspecifica que se filtren los registros para la tabla de salida. Solo los registros que coinciden con el valor especificado en la columna _Position_ se incluyen en la tabla de salida. Predeterminado: -1 Valor mínimo: 1
sparseCuando se establece en True y la acción se ejecuta en un servidor distribuido, cada hilo lee datos que pertenecen solo a unos pocos grupos. Por defecto, cada hilo lee registros de muchos o todos los grupos. Especifique True para mejorar el rendimiento cuando hay muchos hilos en todos los workers, muchos grupos o ambos. En algunos casos, sparse se habilita automáticamente. Predeterminado: FALSE
attributesEspecifica los atributos de la variable.
casOutEspecifica la configuración de una tabla de salida.
copyVarsEspecifica las columnas a copiar de la tabla de entrada a la tabla de salida casOut. Las variables especificadas en el parámetro inputs y las columnas groupBy se copian automáticamente. Aliases: copyVar, extraVars
groupbyTableEspecifica una tabla de entrada que contiene los grupos a usar en un análisis de agrupación. Caslib: Especifica la caslib para la tabla de filtro. Por defecto, se utiliza la caslib activa. DataSourceOptions: Especifica las opciones de la fuente de datos. ImportOptions: Especifica la configuración para leer una tabla de una fuente de datos. Name: Especifica el nombre de la tabla de filtro. Where: Especifica una expresión para subconjuntar los datos de la tabla de filtro.
inputsEspecifica las variables de entrada para el análisis.
tableEspecifica el nombre de la tabla, la caslib y otros parámetros comunes.

Ejemplos