Publié le :
ETL CREATION_INTERNE

Démonstration: Concaténation de jeux de données SAS

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script commence par créer trois jeux de données (advisees_MPH, advisees_DrPH, advisees_MHA) via des blocs DATA step avec des instructions DATALINES pour peupler les données. Il illustre ensuite la concaténation simple de jeux de données ayant les mêmes variables (advisees_MPH et advisees_DrPH en advisees). Une seconde démonstration montre la concaténation de jeux de données avec des noms de variables différents (advisees_MPH et advisees_MHA en advisees_Masters), nécessitant l'utilisation de l'option RENAME dans la déclaration SET pour harmoniser les noms de colonnes 'degree' et 'program'.
Analyse des données

Type : CREATION_INTERNE


Les données sources sont créées directement dans le script à l'aide de blocs DATA step et d'instructions DATALINES.

1 Bloc de code
DATA STEP Data
Explication :
Création du jeu de données 'advisees_MPH' avec les variables 'first', 'gender' et 'program'. Les données sont saisies via des instructions DATALINES.
Copié !
1DATA advisees_MPH;
2 INPUT first $ gender $ program $;
3 DATALINES;
4 Alison F MPH
5 Ming F MPH
6RUN;
2 Bloc de code
DATA STEP Data
Explication :
Création du jeu de données 'advisees_DrPH' avec les mêmes variables que 'advisees_MPH'. Les données sont saisies via des instructions DATALINES.
Copié !
1DATA advisees_DrPH;
2 INPUT first $ gender $ program $;
3 DATALINES;
4 Tiffany F DrPH
5 Florence F DrPH
6RUN;
3 Bloc de code
DATA STEP
Explication :
Concaténation des jeux de données 'advisees_MPH' et 'advisees_DrPH' dans un nouveau jeu de données 'advisees'. Comme les variables sont identiques, la fusion est directe.
Copié !
1 
2DATA advisees;
3SET advisees_MPH advisees_DrPH;
4RUN;
5 
4 Bloc de code
PROC PRINT
Explication :
Affiche le contenu du jeu de données 'advisees', résultant de la première concaténation.
Copié !
1PROC PRINT DATA = advisees;
2RUN;
5 Bloc de code
DATA STEP Data
Explication :
Création du jeu de données 'advisees_MHA' avec les variables 'first', 'gender' et 'degree'. La variable 'degree' est intentionnellement différente de 'program' dans les jeux de données précédents.
Copié !
1DATA advisees_MHA;
2 INPUT first $ gender $ degree $;
3 DATALINES;
4 Jessica F MHA
5 Ryan M MHA
6RUN;
6 Bloc de code
DATA STEP
Explication :
Tentative de concaténation des jeux de données 'advisees_MPH' et 'advisees_MHA'. En raison des noms de variables différents ('program' et 'degree'), les valeurs correspondantes seront manquantes dans le jeu de données résultant là où la variable n'existe pas dans le jeu de données source.
Copié !
1 
2DATA advisees_Masters;
3SET advisees_MPH advisees_MHA;
4RUN;
5 
7 Bloc de code
PROC PRINT
Explication :
Affiche le contenu du jeu de données 'advisees_Masters' après la concaténation sans renommage, montrant les valeurs manquantes dues aux noms de variables différents.
Copié !
1PROC PRINT DATA = advisees_Masters;
2RUN;
8 Bloc de code
DATA STEP
Explication :
Re-concaténation des jeux de données 'advisees_MPH' et 'advisees_MHA'. L'option RENAME est utilisée pour renommer temporairement la variable 'degree' de 'advisees_MHA' en 'program' au moment de la lecture, permettant une concaténation correcte des données dans une seule variable 'program'.
Copié !
1 
2DATA advisees_Masters;
3SET advisees_MPH advisees_MHA (rename = (degree = program));
4RUN;
5 
9 Bloc de code
PROC PRINT
Explication :
Affiche le contenu final du jeu de données 'advisees_Masters', démontrant une concaténation réussie grâce à l'utilisation de l'option RENAME.
Copié !
1PROC PRINT DATA = advisees_Masters;
2RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.