Réalise des tabulations à une ou deux voies pour produire des tables de fréquences pour des variables catégorielles. Cette action est fondamentale pour l'analyse exploratoire des données, permettant de comprendre la distribution des données et les relations entre les variables.
| Paramètre | Description |
|---|---|
| acrossBy | Lorsque défini sur Vrai, les niveaux des variables de ligne et de colonne sont les mêmes pour toutes les variables de regroupement (group-by). |
| aggregator | Spécifie l'agrégateur pour lequel les valeurs de la variable de poids sont agrégées en un score d'ordre de classement si une variable de poids est spécifiée. |
| association | Lorsque défini sur Vrai, les mesures d'association entre la variable de ligne et de colonne de la tabulation croisée sont calculées. |
| chiSq | Lorsque défini sur Vrai, les statistiques du chi-carré sont calculées pour le test d'indépendance des variables de ligne et de colonne ainsi que leurs p-valeurs asymptotiques. |
| col | Spécifie la variable de colonne pour la tabulation à deux voies. |
| colFormat | Spécifie un format pour la variable de colonne. |
| colNBins | Spécifie le nombre de classes à utiliser pour la discrétisation de la variable de colonne. |
| descending | Lorsque défini sur Vrai, les niveaux formatés des variables sont organisés par ordre décroissant. |
| fullTable | Lorsque défini sur Vrai, une analyse complète de la table est effectuée. |
| groupByLimit | Spécifie le nombre maximum de niveaux dans un ensemble de regroupement. Lorsque le serveur atteint ce nombre de niveaux, il s'arrête et ne renvoie pas de résultat. Utile pour éviter de créer de très grands ensembles de résultats. |
| includeMissing | Lorsque défini sur Vrai, les valeurs manquantes sont incluses dans la tabulation croisée comme un niveau de variable. |
| niceBinning | Lorsque défini sur Vrai, un algorithme de discrétisation optimisé ('nice binning') est utilisé pour les variables numériques. |
| orderByGbyRaw | Lorsque défini sur Vrai, l'ordre des variables de regroupement est basé sur les valeurs brutes des variables, et non sur les valeurs formatées. |
| row | Spécifie la variable de ligne pour la tabulation. |
| rowFormat | Spécifie un format pour la variable de ligne. |
| rowNBins | Spécifie le nombre de classes à utiliser pour la discrétisation de la variable de ligne. |
| table | Spécifie la table d'entrée à analyser. |
| weight | Spécifie la variable de poids numérique utilisée pour calculer les statistiques dans les cellules et les marges de la table. |
Ce code SAS crée une table CAS nommée 'CARS' dans la caslib 'CASUSER'. Cette table contient des informations sur différents modèles de voitures, y compris leur type, leur origine et leur prix de vente conseillé (MSRP). Elle sera utilisée pour illustrer les exemples de tabulation croisée.
| 1 | DATA casuser.cars; |
| 2 | LENGTH Type $ 10 Origin $ 10; |
| 3 | INFILE DATALINES delimiter=','; |
| 4 | INPUT Type $ Origin $ MSRP; |
| 5 | DATALINES; |
| 6 | Sedan,Asia,25000 |
| 7 | SUV,Asia,35000 |
| 8 | Sports,Europe,60000 |
| 9 | Sedan,USA,28000 |
| 10 | SUV,USA,40000 |
| 11 | Truck,USA,45000 |
| 12 | Sedan,Europe,55000 |
| 13 | SUV,Europe,65000 |
| 14 | ; |
| 15 | RUN; |
Cet exemple réalise une tabulation de fréquence simple sur la variable 'Type' de la table 'CARS'. Cela permet de compter le nombre de voitures de chaque type.
| 1 | PROC CAS; |
| 2 | SIMPLE.crossTab / |
| 3 | TABLE={name='cars'}, |
| 4 | row='Type'; |
| 5 | RUN; |
Cet exemple effectue une tabulation croisée à deux voies entre les variables 'Type' et 'Origin'. Il calcule également les statistiques du chi-carré ('chiSq=true') et les mesures d'association ('association=true') pour tester l'indépendance entre le type de voiture et son origine.
| 1 | PROC CAS; |
| 2 | SIMPLE.crossTab / |
| 3 | TABLE={name='cars'}, |
| 4 | row='Type', |
| 5 | col='Origin', |
| 6 | chiSq=true, |
| 7 | association=true; |
| 8 | RUN; |
Cet exemple montre comment utiliser une variable de poids ('weight'). La tabulation croisée entre 'Type' et 'Origin' est effectuée, mais la fréquence dans chaque cellule est la somme des valeurs de la variable 'MSRP' (prix de vente) au lieu du simple décompte.
| 1 | PROC CAS; |
| 2 | SIMPLE.crossTab / |
| 3 | TABLE={name='cars'}, |
| 4 | row='Type', |
| 5 | col='Origin', |
| 6 | weight='MSRP'; |
| 7 | RUN; |