simple

mdSummary

Beschreibung

Berechnet mehrdimensionale Zusammenfassungen von numerischen Variablen. Diese Aktion erstellt deskriptive Statistiken für Variablen über alle Beobachtungen und innerhalb von Gruppen von Beobachtungen. Diese Aktion ist für die explorative Datenanalyse sehr nützlich.

simple.mdSummary { attributes={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, ...}, descending=TRUE | FALSE, groupByLimit=64-bit-integer, includeMissing=TRUE | FALSE, inputs={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer }, ...}, orderByGbyRaw=TRUE | FALSE, returnValidSet=TRUE | FALSE, sets={{ groupBy={"variable-name-1", ...}, groupByFmts={"string-1", ...}, where="where-expression" }, ...}, subSet={"CSS", "CV", "KURTOSIS", "MAX", "MEAN", "MIN", "N", "NMISS", "PROBT", "SKEWNESS", "STD", "STDERR", "SUM", "T", "TSTAT", "USS", "VAR"}, table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1, ...}, groupBy={{...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | ...}, name="table-name", orderBy={{...}}, singlePass=TRUE | FALSE, vars={{...}}, where="where-expression", whereTable={{...}} }, weight="variable-name" }
Einstellungen
ParameterBeschreibung
attributesGibt die Variablenattribute an.
descendingWenn auf True gesetzt, werden die formatierten Stufen der Variablen in absteigender Reihenfolge angeordnet.
groupByLimitGibt die maximale Anzahl von Stufen in einem Group-by-Satz an. Wenn der Server diese Anzahl von Stufen feststellt, stoppt der Server und gibt kein Ergebnis zurück.
includeMissingWenn auf True gesetzt, werden fehlende Werte bei der Bestimmung der Group-by-Werte berücksichtigt.
inputsGibt die Eingabevariablen für die Analyse an.
orderByGbyRawWenn auf True gesetzt, basiert die Sortierung der Group-by-Variablen auf den Rohwerten der Variablen, nicht auf den formatierten Werten.
returnValidSetWenn auf True gesetzt, werden die Group-by-Sätze zurückgegeben, deren Größe das angegebene Group-by-Limit nicht überschreitet.
setsGibt die Satzspezifikationen an.
subSetGibt die zu generierenden zusammenfassenden Statistiken an. Mögliche Werte sind CSS, CV, KURTOSIS, MAX, MEAN, MIN, N, NMISS, PROBT, SKEWNESS, STD, STDERR, SUM, T, TSTAT, USS, VAR.
tableGibt den Tabellennamen, die Caslib und andere gemeinsame Parameter an, die für die Analyse verwendet werden sollen.
weightGibt eine numerische Variable an, deren Werte die Werte der Analysevariablen gewichten.
Erstellung von Beispieldaten

Dieser Code erstellt eine Beispieltabelle namens 'CARS' in der aktuellen CAS-Bibliothek. Diese Tabelle enthält Daten über verschiedene Automodelle, einschließlich ihrer Marke, ihres Typs und Leistungsmerkmalen wie PS und Durchschnittsverbrauch.

Kopiert!
1DATA cars; SET sashelp.cars; RUN;

Beispiele

Dieses Beispiel berechnet die grundlegenden deskriptiven Statistiken (Anzahl, Minimum, Maximum, Mittelwert, Standardabweichung) für die Variable 'MPG_City', gruppiert nach der Variable 'Origin'.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3SIMPLE.mdSummary / TABLE={name='cars'} inputs={{name='MPG_City'}} sets={{groupBy={'Origin'}}};
4 
5RUN;
6 
7QUIT;
8 
Ergebnis :
Eine Ergebnistabelle, die die grundlegenden Statistiken für 'MPG_City' für jeden Ursprung ('Origin') der Autos anzeigt.

Dieses Beispiel zeigt eine komplexere Verwendung der mdSummary-Aktion. Es berechnet zwei verschiedene Statistikensätze. Der erste Satz berechnet Mittelwert (MEAN), Standardfehler (STDERR) und die Anzahl der Beobachtungen (N) für 'Horsepower', gruppiert nach 'Type' und 'DriveTrain'. Der zweite Satz berechnet Schiefe (SKEWNESS) und Kurtosis (KURTOSIS) für 'EngineSize', gruppiert nur nach 'Type' und wendet einen Filter an, um nur Limousinen ('Sedan') zu berücksichtigen.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3SIMPLE.mdSummary / TABLE={name='cars'} inputs={{name='Horsepower'}, {name='EngineSize'}} sets={{groupBy={'Type', 'DriveTrain'}, subSet={'MEAN', 'STDERR', 'N'}}, {groupBy={'Type'}, where='Type="Sedan"', subSet={'SKEWNESS', 'KURTOSIS'}}};
4 
5RUN;
6 
7QUIT;
8 
Ergebnis :
Zwei Ergebnistabellen. Die erste Tabelle zeigt Mittelwert, Standardfehler und Anzahl für 'Horsepower', aufgeschlüsselt nach Autotyp und Antriebsart. Die zweite Tabelle zeigt Schiefe und Kurtosis für 'EngineSize' nur für den Typ 'Sedan'.

FAQ

Was macht die Aktion mdSummary?
Was ist eine Voraussetzung für die Eingabedaten der mdSummary-Aktion?
Welche Funktion hat der Parameter `subSet`?
Wie kann ich fehlende Werte bei Gruppierungsoperationen berücksichtigen?
Wie kann die Sortierreihenfolge der Gruppierungsvariablen gesteuert werden?