Führt ein- oder zweidimensionale Tabellierungen durch. Diese Aktion ist grundlegend für die deskriptive Statistik und ermöglicht es, die Verteilung von kategorialen Variablen zu verstehen und Beziehungen zwischen ihnen zu untersuchen. Sie ist vergleichbar mit der Prozedur FREQ in Base SAS, ist aber für die Ausführung in der verteilten CAS-Umgebung optimiert.
| Parameter | Beschreibung |
|---|---|
| acrossBy | Wenn auf True gesetzt, sind die Ebenen der Zeilen- und Spaltenvariablen über die Gruppierungsvariablen hinweg gleich. |
| aggregator | Gibt den Aggregator an, für den die Werte der Gewichtungsvariable in einen Rangordnungswert zusammengefasst werden, wenn eine Gewichtungsvariable angegeben ist. |
| association | Wenn auf True gesetzt, werden Assoziationsmaße zwischen der Zeilen- und Spaltenvariable der Kreuztabelle berechnet. |
| chiSq | Wenn auf True gesetzt, werden Chi-Quadrat-Statistiken für den Unabhängigkeitstest der Zeilen- und Spaltenvariablen und ihre asymptotischen p-Werte berechnet. |
| col | Gibt die Spaltenvariable an. |
| colFormat | Gibt ein Format für die Spaltenvariable an. |
| colNBins | Gibt die Anzahl der Bins an, die beim Binning der Spaltenvariable verwendet werden sollen. |
| descending | Wenn auf True gesetzt, werden die formatierten Ebenen der Variablen in absteigender Reihenfolge angeordnet. |
| fullTable | Wenn auf True gesetzt, wird ein vollständiger Tabellenscan durchgeführt. |
| groupByLimit | Gibt die maximale Anzahl von Ebenen in einem Group-by-Satz an. Wenn der Server diese Anzahl von Ebenen feststellt, stoppt der Server und gibt kein Ergebnis zurück. Geben Sie diesen Parameter an, wenn Sie das Erstellen großer Ergebnismengen bei Group-by-Operationen vermeiden möchten. |
| includeMissing | Wenn auf True gesetzt, werden fehlende Werte in die Kreuztabelle aufgenommen. |
| niceBinning | Wenn auf True gesetzt, wird der 'nice binning'-Algorithmus verwendet. |
| orderByGbyRaw | Wenn auf True gesetzt, basiert die Reihenfolge der Group-by-Variablen auf den Rohwerten der Variablen, nicht auf den formatierten Werten. |
| row | Gibt die Zeilenvariable an. |
| rowFormat | Gibt ein Format für die Zeilenvariable an. |
| rowNBins | Gibt die Anzahl der Bins an, die beim Binning der Zeilenvariable verwendet werden sollen. |
| table | Gibt die zu verwendende Eingabetabelle an. Dies ist ein obligatorischer Parameter. |
| weight | Gibt die numerische Gewichtungsvariable an, die zur Berechnung der Statistiken in der Tabellenzelle und in den Rändern der Tabelle verwendet wird. |
Dieser Code erstellt eine Beispieltabelle 'cars_crosstab' in der CAS-Bibliothek 'casuser', die für die folgenden Beispiele verwendet wird. Sie enthält Daten über verschiedene Automodelle, einschließlich ihres Typs, ihrer Herkunft und ihres empfohlenen Verkaufspreises (MSRP).
| 1 | |
| 2 | DATA casuser.cars_crosstab; |
| 3 | SET sashelp.cars; |
| 4 | RUN; |
| 5 |
Dieses Beispiel zeigt, wie eine einfache Häufigkeitstabelle für die Variable 'Type' aus der Tabelle 'cars_crosstab' erstellt wird. Dies ist die grundlegendste Verwendung der Aktion, um die Verteilung einer einzelnen kategorialen Variable zu erhalten.
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.crossTab / TABLE={name='cars_crosstab'}, row='Type'; |
| 4 | |
| 5 | RUN; |
| 6 |
Dieses Beispiel führt eine zweidimensionale Kreuztabelle der Variablen 'Type' und 'Origin' durch und verwendet dabei die Variable 'MSRP' als Gewichtung. Es berechnet auch Chi-Quadrat-Statistiken ('chiSq=true') und Assoziationsmaße ('association=true'), um die Beziehung zwischen Fahrzeugtyp und Herkunft zu untersuchen.
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.crossTab / TABLE={name='cars_crosstab'}, row='Type', col='Origin', weight='MSRP', chiSq=true, association=true; |
| 4 | |
| 5 | RUN; |
| 6 |