L'action `groupByInfo` de l'ensemble d'actions 'Simple Analytics' est utilisée pour calculer l'index et la fréquence de chaque groupe, ainsi que l'index de chaque enregistrement au sein de son groupe. Elle offre des fonctionnalités d'analyse de base pour le regroupement de données, permettant de générer des colonnes d'informations détaillées sur les groupes, telles que la fréquence cumulative, la fréquence de groupe, les identifiants de groupe et la position des enregistrements au sein de leurs groupes ou sous-groupes.
| Paramètre | Description |
|---|---|
| attributes | Spécifie les attributs de la variable. Pour plus d'informations sur la spécification du paramètre attributes, consultez le paramètre commun casinvardesc. |
| casOut | Spécifie les paramètres d'une table de sortie. Pour plus d'informations sur la spécification du paramètre casOut, consultez le paramètre commun casouttable. |
| copyVars | Spécifie les colonnes à copier de la table d'entrée vers la table de sortie casOut. Les variables spécifiées dans le paramètre inputs et les colonnes groupBy sont automatiquement copiées. |
| cumFreqName | Spécifie le nom de la colonne pour la fréquence cumulative dans la table de sortie. La colonne affiche la fréquence cumulative du groupe auquel l'enregistrement appartient, par rapport à la table d'entrée. Le nom de colonne par défaut est _CumFreq_. |
| frequencyName | Spécifie le nom de la colonne pour les fréquences de groupe dans la table de sortie. Le nom de colonne par défaut est _Frequency_. |
| generatedColumns | Spécifie les colonnes générées à inclure dans la table de sortie. - ALL: Spécifie d'inclure toutes les colonnes générées dans la table de sortie. - CUMFREQ: Spécifie d'inclure la colonne _CumFreq_ dans la table de sortie. Si le paramètre nSubGroupVars est spécifié, la colonne _SubCumFreq_ est également incluse. - F: Spécifie d'inclure les colonnes qui contiennent les valeurs formatées des variables groupBy dans la table de sortie. Ce sont les colonnes dont les noms se terminent par _F. - FREQUENCY: Spécifie d'inclure la colonne _Frequency_ dans la table de sortie. - GROUPID: Spécifie d'inclure la colonne _GroupID_ dans la table de sortie. - NONE: Spécifie de n'inclure aucune colonne générée dans la table de sortie. - POSITION: Spécifie d'inclure la colonne _Position_ dans la table de sortie. |
| groupIDName | Spécifie le nom de la colonne pour les identifiants de groupe dans la table de sortie. Le nom de colonne par défaut est _GroupID_. |
| positionName | Spécifie le nom de la colonne pour la position de l'enregistrement au sein de son groupe dans la table de sortie. Le nom de colonne par défaut est _Position_. |
| subGroupCumFreqName | Spécifie le nom de la colonne pour la fréquence cumulative des sous-groupes auxquels chaque enregistrement appartient. Le nom de colonne par défaut est _SubCumFreq_. |
| subGroupFrequencyName | Spécifie le nom de la colonne pour la fréquence de l'enregistrement au sein de son sous-groupe. Le nom de colonne par défaut est _SubFrequency_. |
| subGroupIDName | Spécifie le nom de la colonne pour les identifiants de sous-groupe. Le nom de colonne par défaut est _SubGroupID_. |
| subGroupPositionName | Spécifie le nom de la colonne pour les fréquences de sous-groupe. Le nom de colonne par défaut est _SubPosition_. |
| algorithm2 | Spécifie un algorithme plus efficace pour le traitement des informations de groupe. Le traitement avec cet algorithme peut être plus rapide lorsque les données contiennent un grand nombre de groupes et que la grille que vous utilisez a de nombreux nœuds. (Par défaut: False). Note: Lorsque True est spécifié, la table de sortie spécifiée par casOut= ne contient pas de colonnes de valeurs formatées pour les variables d'entrée. |
| details | Spécifie que les messages tels que le nombre de groupes et d'autres détails sont écrits dans le journal SAS. (Par défaut: False) |
| divider | Spécifie le caractère utilisé pour diviser les valeurs de caractères des variables d'entrée. Spécifiez un caractère qui n'est pas présent dans ces variables. |
| groupByLimit | Spécifie le nombre maximal de niveaux dans un ensemble de regroupement. Lorsque le serveur détermine ce nombre de niveaux, il s'arrête et ne renvoie pas de résultat. Spécifiez ce paramètre si vous voulez éviter de créer de grands ensembles de résultats dans les opérations de regroupement. (Valeur minimale: 1) |
| includeDuplicates | Spécifie que la table de sortie contient des enregistrements en double. (Par défaut: False) |
| includeMissing | Spécifie que les groupes qui ont une valeur manquante dans une variable groupBy sont inclus dans la table casOut. (Par défaut: False) |
| inputRegEx | Spécifie une liste d'expressions régulières, une pour chaque variable de la liste d'entrées. |
| journalTrace | Lorsqu'il est défini sur True, l'action écrit des informations de traçage détaillées dans le journal SAS. (Par défaut: False) |
| keyModify | Spécifie si vous souhaitez que les valeurs de caractères des variables d'entrée soient justifiées à gauche (L), justifiées à droite (R), converties en majuscules (U) et que les blancs consécutifs soient condensés en un seul blanc (C). |
| maxFrequency | Spécifie que la table de sortie contient des enregistrements avec _Frequency_ inférieure ou égale à ce nombre. (Par défaut: INT64_MAX, Valeur minimale: 1) |
| maxPosition | Spécifie que la table de sortie contient des enregistrements avec _Position_ inférieure ou égale à ce nombre. (Par défaut: INT64_MAX, Valeur minimale: 1) |
| minFrequency | Spécifie que la table de sortie contient des enregistrements avec _Frequency_ supérieure ou égale à ce nombre. (Par défaut: 0, Valeur minimale: 1) |
| minGroupsLL | Spécifie le nombre minimum de groupes requis pour utiliser les algorithmes parallèles après lecture. (Par défaut: 100000, Valeur minimale: 1) |
| minPosition | Spécifie que la table de sortie contient des enregistrements avec _Position_ supérieure ou égale à ce nombre. (Par défaut: -1, Valeur minimale: 1) |
| noVars | Lorsqu'il est défini sur True, aucune variable n'est automatiquement copiée de la table d'entrée vers la table de sortie. Par défaut, toutes les colonnes qui ne sont pas dans les paramètres inputs, groupBy, weight ou frequency sont copiées. (Par défaut: False) |
| nSubGroupVars | Spécifie le nombre de variables dans la liste de variables d'entrée dont les valeurs déterminent les sous-groupes. (Par défaut: 0, Valeur minimale: 1) |
| position | Spécifie de filtrer les enregistrements pour la table de sortie. Seuls les enregistrements qui correspondent à la valeur spécifiée dans la colonne _Position_ sont inclus dans la table de sortie. (Par défaut: -1, Valeur minimale: 1) |
| sparse | Lorsqu'il est défini sur True et que l'action s'exécute sur un serveur distribué, chaque thread lit les données qui appartiennent à seulement quelques groupes. Par défaut, chaque thread lit les enregistrements de nombreux groupes ou de tous les groupes. Spécifiez True pour améliorer les performances lorsqu'il y a de nombreux threads sur tous les workers, de nombreux groupes, ou les deux. Dans certains cas, sparse est activé automatiquement. (Par défaut: False) |
| inputs | Spécifie les variables d'entrée pour l'analyse. Pour plus d'informations sur la spécification du paramètre inputs, consultez le paramètre commun casinvardesc. |
| table | Spécifie le nom de la table, la bibliothèque cas et d'autres paramètres communs. Pour plus d'informations sur la spécification du paramètre table, consultez le paramètre commun castable. |
| groupbyTable.casLib | Spécifie la bibliothèque cas pour la table de filtre. Par défaut, la bibliothèque cas active est utilisée. |
| groupbyTable.dataSourceOptions | Spécifie les options de la source de données. Pour plus d'informations sur la spécification du paramètre dataSourceOptions, consultez le paramètre commun dataSourceOptions. |
| groupbyTable.importOptions | Spécifie les paramètres de lecture d'une table à partir d'une source de données. Pour plus d'informations sur la spécification du paramètre importOptions, consultez le paramètre commun importOptions. |
| groupbyTable.name | Spécifie le nom de la table de filtre. |
| groupbyTable.where | Spécifie une expression pour sous-échantillonner les données de la table de filtre. |
Le document HTML fourni ne contient pas d'exemples simples directement intégrés. Il fait référence à un lien externe pour des exemples. Vous devriez consulter la documentation SAS officielle pour des exemples concrets.
| 1 | // Exemple non fourni dans le document HTML |
| 2 | PROC CAS; |
| 3 | SESSION casauto; |
| 4 | SIMPLE.groupByInfo / TABLE='myTable', inputs={'column1', 'column2'}; |
| 5 | QUIT; |
Le document HTML fourni ne contient pas d'exemples détaillés directement intégrés. Il fait référence à un lien externe pour des exemples. Vous devriez consulter la documentation SAS officielle pour des exemples concrets.
| 1 | // Exemple non fourni dans le document HTML |
| 2 | PROC CAS; |
| 3 | SESSION casauto; |
| 4 | /* Charger une table exemple si nécessaire */ |
| 5 | /* caslib _all_ assign; |
| 6 | data casuser.myTable; |
| 7 | input column1 $ column2 $; |
| 8 | datalines; |
| 9 | A X |
| 10 | A Y |
| 11 | B X |
| 12 | B Z |
| 13 | A X |
| 14 | ; |
| 15 | run; |
| 16 | */ |
| 17 | |
| 18 | SIMPLE.groupByInfo / |
| 19 | TABLE={name='myTable'}, |
| 20 | inputs={'column1', 'column2'}, |
| 21 | generatedColumns={'ALL'}, |
| 22 | details=TRUE, |
| 23 | casOut={name='groupByInfoOutput', replace=TRUE}; |
| 24 | QUIT; |