simple

freq

Description

L'action `freq` du jeu d'actions `simple` génère une distribution de fréquences pour une ou plusieurs variables d'une table CAS. Elle produit des statistiques telles que le nombre d'occurrences (fréquence), le pourcentage, ainsi que les fréquences et pourcentages cumulés. Cette action est fondamentale pour l'exploration de données, permettant d'identifier rapidement la répartition des valeurs, les modes, et les valeurs aberrantes ou manquantes dans des données catégorielles ou discrètes.

simple.freq <result=results> <status=rc> / attributes={{format="string", formattedLength=integer, label="string", * name="variable-name", nfd=integer, nfl=integer}, {...}}, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, descending=TRUE | FALSE, groupByLimit=64-bit-integer, groupbyTable={casLib="string", dataSourceOptions={...}, importOptions={...}, * name="table-name", where="where-expression"}, includeMissing=TRUE | FALSE, inputs={{format="string", formattedLength=integer, label="string", * name="variable-name", nfd=integer, nfl=integer}, {...}}, raw=TRUE | FALSE, rawOrder=TRUE | FALSE, * table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", * name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", * name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | ...}, * name="table-name", orderBy={{format="string", formattedLength=integer, label="string", * name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", * name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}, writePartOnTheFly=TRUE | FALSE;
Paramètres
ParamètreDescription
tableSpécifie la table d'entrée (in-memory) à analyser. Inclut des options pour le filtrage (where), les variables calculées, et le groupement (groupBy).
inputsSpécifie les variables pour lesquelles calculer la distribution de fréquences. Si ce paramètre est omis, l'action peut tenter d'analyser toutes les variables ou demander une spécification explicite selon le contexte.
casOutSpécifie la table de sortie où seront stockés les résultats détaillés des fréquences (avec des colonnes pour la variable, la valeur, la fréquence, etc.).
includeMissingSi défini à TRUE, les valeurs manquantes sont traitées comme une catégorie distincte et incluses dans les calculs de fréquence et de pourcentage.
descendingSi défini à TRUE, les résultats sont triés par ordre décroissant de fréquence (ou de valeur, selon le contexte de rawOrder).
rawUtilise les valeurs brutes (non formatées) pour l'analyse si défini à TRUE.
rawOrderSi défini à TRUE, le tri des résultats se base sur les valeurs brutes des données plutôt que sur les valeurs formatées.
Préparation des Données Voir la fiche de ce code dataprep
Chargement des données de test

Charge la table 'cars' de la bibliothèque SASHELP vers la mémoire CAS pour l'analyse.

Copié !
1 
2PROC CAS;
3loadTable
4SOURCE="cars" caslib="sashelp" casout={name="cars", replace=true};
5 
6RUN;
7 

Exemples

Calcule la distribution de fréquence pour la variable 'Origin' (Origine des voitures) de la table 'cars'.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.freq / TABLE={name="cars"} inputs={"Origin"};
4 
5RUN;
6 
Résultat :
Affiche un tableau listant chaque origine unique (Asia, Europe, USA), leur fréquence (nombre de voitures), le pourcentage, ainsi que les fréquences cumulées.

Calcule les fréquences pour 'Type' et 'Origin', inclut les valeurs manquantes dans le calcul, et sauvegarde les résultats dans une table CAS nommée 'freq_results'.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3SIMPLE.freq / TABLE={name="cars"} inputs={"Type", "Origin"} includeMissing=true casOut={name="freq_results", replace=true};
4 
5RUN;
6 
Résultat :
Génère deux analyses de fréquence distinctes à l'écran et crée une table 'freq_results' en mémoire contenant les données brutes des distributions pour une utilisation ultérieure.

FAQ

Quelle est la fonction principale de l'action freq ?
Comment inclure les valeurs manquantes dans l'analyse de fréquence ?
Comment spécifier les variables d'entrée à analyser ?
Est-il possible de baser le tri des groupes sur les valeurs brutes plutôt que sur les valeurs formatées ?
Comment éviter la création d'ensembles de résultats trop volumineux lors d'opérations de regroupement (group-by) ?
Comment sauvegarder les résultats de l'analyse dans une table en sortie ?
Comment trier les niveaux des variables de regroupement par ordre décroissant ?