mdSummary - WeAreCAS

Q: Was macht die Aktion mdSummary?

Die Aktion mdSummary berechnet mehrdimensionale Zusammenfassungen von numerischen Variablen.

Q: Was ist eine Voraussetzung für die Eingabedaten der mdSummary-Aktion?

Die Eingabedaten müssen mindestens eine numerische Variable enthalten. Andernfalls gibt diese Aktion einen Fehlerstatus und ein leeres Ergebnis zurück.

Q: Welche Funktion hat der Parameter `subSet`?

Der Parameter `subSet` gibt die zu erzeugenden Zusammenfassungsstatistiken an. Mögliche Werte sind 'CSS', 'CV', 'KURTOSIS', 'MAX', 'MEAN', 'MIN', 'N', 'NMISS', 'PROBT', 'SKEWNESS', 'STD', 'STDERR', 'SUM', 'T', 'TSTAT', 'USS' und 'VAR'.

Q: Wie kann ich fehlende Werte bei Gruppierungsoperationen berücksichtigen?

Wenn der Parameter `includeMissing` auf True gesetzt wird, werden fehlende Werte bei der Bestimmung der Gruppierungswerte berücksichtigt.

Q: Wie kann die Sortierreihenfolge der Gruppierungsvariablen gesteuert werden?

Mit dem Parameter `descending` auf True werden die formatierten Ebenen der Variablen in absteigender Reihenfolge angeordnet. Standardmäßig ist die Reihenfolge aufsteigend.

Beschreibung

Berechnet mehrdimensionale Zusammenfassungen von numerischen Variablen. Diese Aktion erstellt deskriptive Statistiken für Variablen über alle Beobachtungen und innerhalb von Gruppen von Beobachtungen. Diese Aktion ist für die explorative Datenanalyse sehr nützlich.

simple.mdSummary { attributes={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, ...}, descending=TRUE | FALSE, groupByLimit=64-bit-integer, includeMissing=TRUE | FALSE, inputs={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, ...}, orderByGbyRaw=TRUE | FALSE, returnValidSet=TRUE | FALSE, sets={{ groupBy={"variable-name-1", ...}, groupByFmts={"string-1", ...}, where="where-expression" }, ...}, subSet={"CSS", "CV", "KURTOSIS", "MAX", "MEAN", "MIN", "N", "NMISS", "PROBT", "SKEWNESS", "STD", "STDERR", "SUM", "T", "TSTAT", "USS", "VAR"}, table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1, ...}, groupBy={{...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | ...}, name="table-name", orderBy={{...}}, singlePass=TRUE | FALSE, vars={{...}}, where="where-expression", whereTable={{...}} }, weight="variable-name" }

Einstellungen

Parameter	Beschreibung
attributes	Gibt die Variablenattribute an.
descending	Wenn auf True gesetzt, werden die formatierten Stufen der Variablen in absteigender Reihenfolge angeordnet.
groupByLimit	Gibt die maximale Anzahl von Stufen in einem Group-by-Satz an. Wenn der Server diese Anzahl von Stufen feststellt, stoppt der Server und gibt kein Ergebnis zurück.
includeMissing	Wenn auf True gesetzt, werden fehlende Werte bei der Bestimmung der Group-by-Werte berücksichtigt.
inputs	Gibt die Eingabevariablen für die Analyse an.
orderByGbyRaw	Wenn auf True gesetzt, basiert die Sortierung der Group-by-Variablen auf den Rohwerten der Variablen, nicht auf den formatierten Werten.
returnValidSet	Wenn auf True gesetzt, werden die Group-by-Sätze zurückgegeben, deren Größe das angegebene Group-by-Limit nicht überschreitet.
sets	Gibt die Satzspezifikationen an.
subSet	Gibt die zu generierenden zusammenfassenden Statistiken an. Mögliche Werte sind CSS, CV, KURTOSIS, MAX, MEAN, MIN, N, NMISS, PROBT, SKEWNESS, STD, STDERR, SUM, T, TSTAT, USS, VAR.
table	Gibt den Tabellennamen, die Caslib und andere gemeinsame Parameter an, die für die Analyse verwendet werden sollen.
weight	Gibt eine numerische Variable an, deren Werte die Werte der Analysevariablen gewichten.

Datenaufbereitung Datenaufbereitungsblatt ansehen

Erstellung von Beispieldaten

Dieser Code erstellt eine Beispieltabelle namens 'CARS' in der aktuellen CAS-Bibliothek. Diese Tabelle enthält Daten über verschiedene Automodelle, einschließlich ihrer Marke, ihres Typs und Leistungsmerkmalen wie PS und Durchschnittsverbrauch.

Kopiert!

1	DATA cars; SET sashelp.cars; RUN;

Beispiele

Dieses Beispiel berechnet die grundlegenden deskriptiven Statistiken (Anzahl, Minimum, Maximum, Mittelwert, Standardabweichung) für die Variable 'MPG_City', gruppiert nach der Variable 'Origin'.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1
2	PROC CAS;
3	SIMPLE.mdSummary / TABLE={name='cars'} inputs={{name='MPG_City'}} sets={{groupBy={'Origin'}}};
4
5	RUN;
6
7	QUIT;
8

Ergebnis :
Eine Ergebnistabelle, die die grundlegenden Statistiken für 'MPG_City' für jeden Ursprung ('Origin') der Autos anzeigt.

Dieses Beispiel zeigt eine komplexere Verwendung der mdSummary-Aktion. Es berechnet zwei verschiedene Statistikensätze. Der erste Satz berechnet Mittelwert (MEAN), Standardfehler (STDERR) und die Anzahl der Beobachtungen (N) für 'Horsepower', gruppiert nach 'Type' und 'DriveTrain'. Der zweite Satz berechnet Schiefe (SKEWNESS) und Kurtosis (KURTOSIS) für 'EngineSize', gruppiert nur nach 'Type' und wendet einen Filter an, um nur Limousinen ('Sedan') zu berücksichtigen.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1
2	PROC CAS;
3	SIMPLE.mdSummary / TABLE={name='cars'} inputs={{name='Horsepower'}, {name='EngineSize'}} sets={{groupBy={'Type', 'DriveTrain'}, subSet={'MEAN', 'STDERR', 'N'}}, {groupBy={'Type'}, where='Type="Sedan"', subSet={'SKEWNESS', 'KURTOSIS'}}};
4
5	RUN;
6
7	QUIT;
8

Ergebnis :
Zwei Ergebnistabellen. Die erste Tabelle zeigt Mittelwert, Standardfehler und Anzahl für 'Horsepower', aufgeschlüsselt nach Autotyp und Antriebsart. Die zweite Tabelle zeigt Schiefe und Kurtosis für 'EngineSize' nur für den Typ 'Sedan'.

FAQ

Was macht die Aktion mdSummary?

Was ist eine Voraussetzung für die Eingabedaten der mdSummary-Aktion?

Welche Funktion hat der Parameter `subSet`?

Wie kann ich fehlende Werte bei Gruppierungsoperationen berücksichtigen?

Wie kann die Sortierreihenfolge der Gruppierungsvariablen gesteuert werden?

Actions associées

simple

compare

Vergleicht zwei Tabellen, indem der Index und die Häufigkeit jeder Gruppe, di...

simple

correlation

Die Aktion `simple.correlation` berechnet Pearson-Produkt-Moment-Korrelatione...

simple

crossTab

Führt ein- oder zweidimensionale Tabellierungen durch. Diese Aktion ist grund...

simple

freq

Erstellt eine Häufigkeitsverteilung für eine oder mehrere Variablen. Diese Ak...

simple

groupBy

Erstellt BY-Gruppen anhand der Variablenwertkombinationen, die durch die Vari...

Inhaltsverzeichnis

Beschreibung

Erstellung von Beispieldaten

Beispiele

Einfache mehrdimensionale Zusammenfassung

Detaillierte mehrdimensionale Zusammenfassung mit mehreren Sätzen und Statistiken

FAQ

Actions associées

compare

correlation

crossTab

freq

groupBy