longToWide - WeAreCAS

Q: Was ist der Hauptzweck der `longToWide`-Aktion?

Die `longToWide`-Aktion gestaltet eine Tabelle, die schmale Datensätze enthält, in eine Tabelle mit breiten Datensätzen um.

Q: Welche Funktion hat der `id`-Parameter?

Der `id`-Parameter gibt die ID-Variablen an, die von der Eingangstabelle in die `casOut`-Ausgabetabelle kopiert werden sollen.

Q: Wie können Statistiken wie der Mittelwert oder die Summe während der Umformung berechnet werden?

Sie können Parameter wie `mean`, `sum`, `max`, `min`, `range` oder `nMiss` verwenden, um die entsprechenden Statistiken für die angegebenen Variablen zu berechnen. Diese Statistiken werden dann der Ausgabetabelle hinzugefügt.

Q: Was bewirkt der `groupBy`-Parameter?

Der `groupBy`-Parameter gibt die Namen der Variablen an, die zur Gruppierung der Ergebnisse verwendet werden sollen.

Q: Wie kann die Reihenfolge der Spalten in der Ausgabetabelle gesteuert werden?

Die Reihenfolge kann mit dem `orderByTable`-Parameter gesteuert werden. Dieser verwendet eine Tabelle, die durch die Aktionen `groupBy` oder `groupByInfo` erzeugt wurde, um die Sortierreihenfolge festzulegen.

Beschreibung

Formt eine Tabelle, die dünne Datensätze enthält, in eine Tabelle mit breiten Datensätzen um.

dataShaping.longToWide / table={...} casOut={...} id={...} inputs={...} [attributes={{...}, ...}}] [charSeparatorChar="string"] [cumFreqName="string"] [frequencyName="string"] [groupIdName="string"] [journalTrace=true | false] [keyModify={"string-1" <, "string-2", ...>}] [maxPosition=integer] [max={"variable-name-1" <, "variable-name-2", ...>}] [mean={"variable-name-1" <, "variable-name-2", ...>}] [min={"variable-name-1" <, "variable-name-2", ...>}] [nMiss={"variable-name-1" <, "variable-name-2", ...>}] [noPrefix=true | false] [numSeparatorNum="string"] [orderByTable={...}] [range={"variable-name-1" <, "variable-name-2", ...>}] [sum={"variable-name-1" <, "variable-name-2", ...>}]

Einstellungen

Parameter	Beschreibung
table	Gibt die zu verwendende Eingabetabelle an.
id	Gibt die ID-Variablen an, die von der Tabelle in die casOut-Tabelle kopiert werden sollen.
inputs	Gibt die Eingabevariablen für die Analyse an.
casOut	Gibt die Einstellungen für eine Ausgabetabelle an.
attributes	Gibt die Variablenattribute an.
charSeparatorChar	Gibt ein Zeichen oder eine Zeichenfolge an, das/die zum Trennen von Teilen der casOut-Variablennamen verwendet wird, wenn beide CHAR- oder VARCHAR-Zeichenfolgen sind.
cumFreqName	Gibt den Variablennamen für die kumulative Häufigkeit in der casOut-Tabelle an. Die Variable zeigt die kumulative Häufigkeit der Gruppe, zu der der Datensatz gehört, in Bezug auf die Eingabetabelle.
frequencyName	Gibt den Variablennamen in der casOut-Tabelle an, der Häufigkeiten enthält. Andernfalls lautet diese Variable _Frequency_.
groupIdName	Gibt die Variable in der Tabelle an, die Gruppen-IDs enthält.
journalTrace	Wenn auf True gesetzt, schreibt detaillierte Nachverfolgungsinformationen in das SAS-Protokoll.
keyModify	Gibt an, ob Sie Zeichenwerte in den Variablen der orderBy-Variablenliste in Großbuchstaben (U) umwandeln, aufeinanderfolgende Leerzeichen zu einem einzigen Leerzeichen (C) verdichten oder beides möchten.
max	Gibt die Variablen an, für die Sie den Maximalwert wünschen.
maxPosition	Gibt den maximalen Wert der Positionsvariable an. Datensätze, deren Positionsvariablenwert größer als der maxPosition-Wert ist, werden ignoriert.
mean	Gibt die Variablen an, für die Sie den Mittelwert wünschen.
min	Gibt die Variablen an, für die Sie den Minimalwert wünschen.
nMiss	Gibt die Variablen an, für die Sie die Anzahl der fehlenden Werte wünschen.
noPrefix	Wenn auf True gesetzt und wenn dieselbe Variable, z. B. foo, für sum, min, max, nMiss oder mean angegeben ist, sind die Variablennamen in der casOut-Tabelle _sum_, _min_, _max_, _nMiss_, _mean_ anstelle von z. B. foo_sum, foo_min usw.
numSeparatorNum	Gibt ein Zeichen oder eine Zeichenfolge an, das/die zum Trennen von Teilen der casOut-Tabellennamen verwendet wird, wenn beide numerisch sind.
orderByTable	Gibt die orderByTable-Tabelle an, die durch Ausführen der Aktion groupBy oder groupByInfo erhalten wird.
range	Gibt die Variablen an, für die Sie den Wertebereich wünschen.
sum	Gibt die Variablen an, für die Sie die Werte summieren möchten.

Datenaufbereitung Datenaufbereitungsblatt ansehen

Erstellen der 'long_data'-Tabelle

Dieser Schritt erstellt eine Beispieltabelle im 'langen' Format mit Studenten-IDs, Fachnamen und deren Noten. Diese Tabelle wird als Eingabe für die Umformung in ein 'breites' Format verwendet.

Kopiert!

1	DATA mycas.long_data;
2	INFILE DATALINES delimiter=',';
3	LENGTH student_id 8 subject $ 10 grade 8;
4	INPUT student_id subject $ grade;
5	DATALINES;
6	1,Math,90
7	1,Science,85
8	1,History,88
9	2,Math,95
10	2,Science,92
11	2,History,89
12	;
13	RUN;

Beispiele

Dieses Beispiel zeigt, wie eine lange Tabelle, in der jedes Fach eine eigene Zeile pro Schüler hat, in eine breite Tabelle umgewandelt wird, in der jeder Schüler eine einzige Zeile mit separaten Spalten für die Noten der einzelnen Fächer hat.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	dataShaping.longToWide /
3	TABLE={name='long_data'},
4	id={'student_id'},
5	inputs={{name='grade'}},
6	casOut={name='wide_data', replace=true};
7	RUN;
8	TABLE.fetch / TABLE='wide_data';
9	RUN;

Ergebnis :
Die Ausgabetabelle 'wide_data' enthält eine Zeile pro 'student_id', mit Spalten für die Noten in 'History', 'Math' und 'Science'.

Dieses Beispiel demonstriert die Verwendung einer 'orderByTable', um die Reihenfolge der neuen Spalten in der breiten Ausgabetabelle explizit zu steuern. Zuerst wird 'groupByInfo' verwendet, um eine Ordnungstabelle zu erstellen, die dann von 'longToWide' genutzt wird.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	dataShaping.groupByInfo /
3	TABLE='long_data'
4	inputs={{name='subject'}}
5	casOut={name='myOrder', replace=true};
6	dataShaping.longToWide /
7	TABLE={name='long_data'}
8	id={'student_id'}
9	inputs={{name='grade'}}
10	orderByTable={name='myOrder'}
11	casOut={name='wide_data_ordered', replace=true};
12	RUN;
13	TABLE.fetch / TABLE='wide_data_ordered';
14	RUN;

Ergebnis :
Die resultierende Tabelle 'wide_data_ordered' hat Spalten, die basierend auf der in 'myOrder' definierten Reihenfolge der Fächer angeordnet sind.

Dieses Beispiel formt nicht nur die Tabelle um, sondern berechnet auch aggregierte Statistiken (Mittelwert und Summe) für die Noten jedes Schülers über alle Fächer hinweg.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	dataShaping.longToWide /
3	TABLE={name='long_data'},
4	id={'student_id'},
5	inputs={{name='grade'}},
6	mean={'grade'},
7	sum={'grade'},
8	casOut={name='wide_data_stats', replace=true};
9	RUN;
10	TABLE.fetch / TABLE='wide_data_stats';
11	RUN;

Ergebnis :
Die Ausgabetabelle 'wide_data_stats' enthält die breiten Notenspalten sowie neue Spalten 'grade_mean' und 'grade_sum', die den Durchschnitt und die Summe der Noten für jeden Schüler darstellen.

FAQ

Was ist der Hauptzweck der `longToWide`-Aktion?

Welche Funktion hat der `id`-Parameter?

Wie können Statistiken wie der Mittelwert oder die Summe während der Umformung berechnet werden?

Was bewirkt der `groupBy`-Parameter?

Wie kann die Reihenfolge der Spalten in der Ausgabetabelle gesteuert werden?

Inhaltsverzeichnis

Beschreibung

Erstellen der 'long_data'-Tabelle

Beispiele

Umformung einer langen Tabelle in eine breite Tabelle

Umformung einer langen Tabelle mithilfe einer Order-By-Tabelle

Umformung einer langen Tabelle und Hinzufügen von Statistiken

FAQ