Berechnet mehrdimensionale Zusammenfassungen von numerischen Variablen. Diese Aktion erstellt deskriptive Statistiken für Variablen über alle Beobachtungen und innerhalb von Gruppen von Beobachtungen. Diese Aktion ist für die explorative Datenanalyse sehr nützlich.
| Parameter | Beschreibung |
|---|---|
| attributes | Gibt die Variablenattribute an. |
| descending | Wenn auf True gesetzt, werden die formatierten Stufen der Variablen in absteigender Reihenfolge angeordnet. |
| groupByLimit | Gibt die maximale Anzahl von Stufen in einem Group-by-Satz an. Wenn der Server diese Anzahl von Stufen feststellt, stoppt der Server und gibt kein Ergebnis zurück. |
| includeMissing | Wenn auf True gesetzt, werden fehlende Werte bei der Bestimmung der Group-by-Werte berücksichtigt. |
| inputs | Gibt die Eingabevariablen für die Analyse an. |
| orderByGbyRaw | Wenn auf True gesetzt, basiert die Sortierung der Group-by-Variablen auf den Rohwerten der Variablen, nicht auf den formatierten Werten. |
| returnValidSet | Wenn auf True gesetzt, werden die Group-by-Sätze zurückgegeben, deren Größe das angegebene Group-by-Limit nicht überschreitet. |
| sets | Gibt die Satzspezifikationen an. |
| subSet | Gibt die zu generierenden zusammenfassenden Statistiken an. Mögliche Werte sind CSS, CV, KURTOSIS, MAX, MEAN, MIN, N, NMISS, PROBT, SKEWNESS, STD, STDERR, SUM, T, TSTAT, USS, VAR. |
| table | Gibt den Tabellennamen, die Caslib und andere gemeinsame Parameter an, die für die Analyse verwendet werden sollen. |
| weight | Gibt eine numerische Variable an, deren Werte die Werte der Analysevariablen gewichten. |
Dieser Code erstellt eine Beispieltabelle namens 'CARS' in der aktuellen CAS-Bibliothek. Diese Tabelle enthält Daten über verschiedene Automodelle, einschließlich ihrer Marke, ihres Typs und Leistungsmerkmalen wie PS und Durchschnittsverbrauch.
| 1 | DATA cars; SET sashelp.cars; RUN; |
Dieses Beispiel berechnet die grundlegenden deskriptiven Statistiken (Anzahl, Minimum, Maximum, Mittelwert, Standardabweichung) für die Variable 'MPG_City', gruppiert nach der Variable 'Origin'.
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.mdSummary / TABLE={name='cars'} inputs={{name='MPG_City'}} sets={{groupBy={'Origin'}}}; |
| 4 | |
| 5 | RUN; |
| 6 | |
| 7 | QUIT; |
| 8 |
Dieses Beispiel zeigt eine komplexere Verwendung der mdSummary-Aktion. Es berechnet zwei verschiedene Statistikensätze. Der erste Satz berechnet Mittelwert (MEAN), Standardfehler (STDERR) und die Anzahl der Beobachtungen (N) für 'Horsepower', gruppiert nach 'Type' und 'DriveTrain'. Der zweite Satz berechnet Schiefe (SKEWNESS) und Kurtosis (KURTOSIS) für 'EngineSize', gruppiert nur nach 'Type' und wendet einen Filter an, um nur Limousinen ('Sedan') zu berücksichtigen.
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.mdSummary / TABLE={name='cars'} inputs={{name='Horsepower'}, {name='EngineSize'}} sets={{groupBy={'Type', 'DriveTrain'}, subSet={'MEAN', 'STDERR', 'N'}}, {groupBy={'Type'}, where='Type="Sedan"', subSet={'SKEWNESS', 'KURTOSIS'}}}; |
| 4 | |
| 5 | RUN; |
| 6 | |
| 7 | QUIT; |
| 8 |