Beispiele: Daten verschachteln

Die Verschachtelung von SAS^©-Datasets ist eine Technik, die es ermöglicht, Beobachtungen aus mehreren Datasets zu einem einzigen zu kombinieren, wobei die durch eine oder mehrere gemeinsame Variablen, die in der BY-Anweisung angegeben sind, definierte Reihenfolge eingehalten wird. Um eine korrekte Verschachtelung zu gewährleisten, ist es zwingend erforderlich, dass alle Eingabe-Datasets zuvor (mit PROC SORT) nach derselben BY-Variablen oder denselben BY-Variablen sortiert oder indiziert wurden. Der Prozess kopiert die Beobachtungen aus den ursprünglichen Datasets in das Ausgabe-Dataset, wobei die sequentielle Reihenfolge der Werte der BY-Variablen beibehalten wird. Wenn BY-Variablenwerte zwischen den Eingabe-Datasets dupliziert sind, bestimmt die Reihenfolge, in der die Datasets in der SET-Anweisung aufgeführt sind, die Reihenfolge der entsprechenden Beobachtungen in der Ausgabe. Wenn ein Eingabe-Dataset Variablen enthält, die in den anderen nicht vorhanden sind, werden die entsprechenden Werte im Ausgabe-Dataset null sein. Die Gesamtzahl der Beobachtungen im Ausgabe-Dataset entspricht der Summe der Beobachtungen aller Eingabe-Datasets.

Datenanalyse

Type : CREATION_INTERNE

Die Beispiele verwenden generierte Daten (Datalines), um die für die Demonstration der Datenverschachtelung erforderlichen SAS-Datasets zu erstellen.

1 Codeblock

DATA STEP / PROC SORT Data

Erklärung :
Dieses Beispiel erstellt zwei Datasets, 'animal' und 'plant', und sortiert sie nach der gemeinsamen Variablen 'common'. Anschließend verschachtelt der DATA-Schritt diese Datasets mithilfe der BY-Anweisung. Das Ausgabe-Dataset 'interleave' enthält die Beobachtungen beider Datasets, geordnet nach 'common'.

Kopiert!

1	DATA animal;
2	INPUT common $ animal $;
3	DATALINES;
4	a Ant
5	b Bird
6	c Cat
7	d Dog
8	e Eagle
9	f Frog
10	;
11	RUN;
12
13	DATA plant;
14	INPUT common $ plant $;
15	DATALINES;
16	a Apple
17	b Banana
18	c Coconut
19	d Dewberry
20	e Eggplant
21	f Fig
22	;
23	RUN;
24
25	PROC SORT DATA=animal; BY common; RUN;
26	PROC SORT DATA=plant; BY common; RUN;
27
28	DATA interleave;
29	SET animal plant;
30	BY common;
31	RUN;
32	PROC PRINT DATA=interleave; RUN;

2 Codeblock

DATA STEP / PROC SORT Data

Erklärung :
Dieses Beispiel demonstriert die Verschachtelung von Datasets ('animalDupes' und 'plantDupes'), die doppelte Werte für die BY-Variable 'common' enthalten. Die Datasets werden vor der Verschachtelung sortiert. Die Reihenfolge der Datasets in der SET-Anweisung beeinflusst die Reihenfolge der Beobachtungen mit denselben 'common'-Werten im Ausgabe-Dataset. Ein zusätzliches Beispiel mit der Reihenfolge 'plantDupes animalDupes' wird zur Veranschaulichung dieses Effekts bereitgestellt.

Kopiert!

1	DATA animalDupes;
2	INPUT common $ animal $;
3	DATALINES;
4	a Ant
5	a Ape
6	b Bird
7	c Cat
8	d Dog
9	e Eagle
10	;
11	RUN;
12
13	DATA plantDupes;
14	INPUT common $ plant $;
15	DATALINES;
16	a Apple
17	b Banana
18	c Coconut
19	c Celery
20	d Dewberry
21	e Eggplant
22	;
23	RUN;
24
25	PROC SORT DATA=animalDupes; BY common; RUN;
26	PROC SORT DATA=plantDupes; BY common; RUN;
27
28	DATA interleave;
29	SET animalDupes plantDupes;
30	BY common;
31	RUN;
32
33	PROC PRINT DATA=interleave; RUN;

3 Codeblock

DATA STEP / PROC SORT Data

Erklärung :
Dieses Beispiel veranschaulicht die Verschachtelung von Datasets ('animalDupes' und 'plantMissing2'), bei denen die BY-Variable 'common' Werte enthält, die in einem Dataset vorhanden sind, aber nicht im anderen (z. B. 'd' in 'animalDupes' und 'f' in 'plantMissing2'). Nach dem Sortieren verschachtelt der DATA-Schritt die Datasets. Variablen, die in einer bestimmten Beobachtung eines Eingabe-Datasets nicht vorhanden sind, erhalten im Ausgabe-Dataset fehlende Werte.

Kopiert!

1	DATA animalDupes;
2	INPUT common $ animal $;
3	DATALINES;
4	a Ant
5	a Ape
6	b Bird
7	c Cat
8	d Dog
9	e Eagle
10	;
11	RUN;
12
13	DATA plantMissing2;
14	INPUT common $ plant $;
15	DATALINES;
16	a Apple
17	b Banana
18	c Coconut
19	e Eggplant
20	f Fig
21	;
22	RUN;
23
24	PROC SORT DATA=animalDupes; BY common; RUN;
25	PROC SORT DATA=plantMissing2; BY common; RUN;
26
27	DATA interleave;
28	SET animalDupes plantMissing2;
29	BY common;
30	RUN;
31
32	PROC PRINT DATA=interleave; RUN;

Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.

Retour à la liste