Veröffentlicht am :
ETL CREATION_INTERNE

Demonstration: Verknüpfung von SAS-Datensätzen

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript beginnt mit der Erstellung von drei Datensätzen (advisees_MPH, advisees_DrPH, advisees_MHA) über DATA-Step-Blöcke mit DATALINES-Anweisungen zur Befüllung der Daten. Es demonstriert dann die einfache Verknüpfung von Datensätzen mit denselben Variablen (advisees_MPH und advisees_DrPH in advisees). Eine zweite Demonstration zeigt die Verknüpfung von Datensätzen mit unterschiedlichen Variablennamen (advisees_MPH und advisees_MHA in advisees_Masters), was die Verwendung der RENAME-Option in der SET-Anweisung erfordert, um die Spaltennamen 'degree' und 'program' zu harmonisieren.
Datenanalyse

Type : CREATION_INTERNE


Die Quelldaten werden direkt im Skript mit DATA-Step-Blöcken und DATALINES-Anweisungen erstellt.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellung des Datensatzes 'advisees_MPH' mit den Variablen 'first', 'gender' und 'program'. Die Daten werden über DATALINES-Anweisungen eingegeben.
Kopiert!
1DATA advisees_MPH;
2 INPUT first $ gender $ program $;
3 DATALINES;
4 Alison F MPH
5 Ming F MPH
6RUN;
2 Codeblock
DATA STEP Data
Erklärung :
Erstellung des Datensatzes 'advisees_DrPH' mit denselben Variablen wie 'advisees_MPH'. Die Daten werden über DATALINES-Anweisungen eingegeben.
Kopiert!
1DATA advisees_DrPH;
2 INPUT first $ gender $ program $;
3 DATALINES;
4 Tiffany F DrPH
5 Florence F DrPH
6RUN;
3 Codeblock
DATA STEP
Erklärung :
Verknüpfung der Datensätze 'advisees_MPH' und 'advisees_DrPH' zu einem neuen Datensatz 'advisees'. Da die Variablen identisch sind, erfolgt die Zusammenführung direkt.
Kopiert!
1 
2DATA advisees;
3SET advisees_MPH advisees_DrPH;
4RUN;
5 
4 Codeblock
PROC PRINT
Erklärung :
Zeigt den Inhalt des Datensatzes 'advisees' an, der aus der ersten Verknüpfung resultiert.
Kopiert!
1PROC PRINT DATA = advisees;
2RUN;
5 Codeblock
DATA STEP Data
Erklärung :
Erstellung des Datensatzes 'advisees_MHA' mit den Variablen 'first', 'gender' und 'degree'. Die Variable 'degree' unterscheidet sich absichtlich von 'program' in den vorherigen Datensätzen.
Kopiert!
1DATA advisees_MHA;
2 INPUT first $ gender $ degree $;
3 DATALINES;
4 Jessica F MHA
5 Ryan M MHA
6RUN;
6 Codeblock
DATA STEP
Erklärung :
Versuch der Verknüpfung der Datensätze 'advisees_MPH' und 'advisees_MHA'. Aufgrund der unterschiedlichen Variablennamen ('program' und 'degree') fehlen die entsprechenden Werte im resultierenden Datensatz dort, wo die Variable im Quelldatensatz nicht existiert.
Kopiert!
1 
2DATA advisees_Masters;
3SET advisees_MPH advisees_MHA;
4RUN;
5 
7 Codeblock
PROC PRINT
Erklärung :
Zeigt den Inhalt des Datensatzes 'advisees_Masters' nach der Verknüpfung ohne Umbenennung, der die fehlenden Werte aufgrund der unterschiedlichen Variablennamen zeigt.
Kopiert!
1PROC PRINT DATA = advisees_Masters;
2RUN;
8 Codeblock
DATA STEP
Erklärung :
Erneute Verknüpfung der Datensätze 'advisees_MPH' und 'advisees_MHA'. Die RENAME-Option wird verwendet, um die Variable 'degree' aus 'advisees_MHA' zum Zeitpunkt des Lesens temporär in 'program' umzubenennen, was eine korrekte Verknüpfung der Daten in einer einzigen Variablen 'program' ermöglicht.
Kopiert!
1 
2DATA advisees_Masters;
3SET advisees_MPH advisees_MHA (rename = (degree = program));
4RUN;
5 
9 Codeblock
PROC PRINT
Erklärung :
Zeigt den endgültigen Inhalt des Datensatzes 'advisees_Masters', der eine erfolgreiche Verknüpfung durch die Verwendung der RENAME-Option demonstriert.
Kopiert!
1PROC PRINT DATA = advisees_Masters;
2RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.