Publié le :
ETL CREATION_INTERNE

Exemples : Combiner des données un-à-un

Ce code est également disponible en : Deutsch English
En attente de validation
L'instruction SET est utilisée pour combiner des jeux de données SAS© observation par observation, sans faire correspondre les valeurs d'une variable commune. L'ordre des instructions SET est crucial : les valeurs des variables partagées du dernier jeu de données spécifié remplacent celles des jeux de données précédents pour la même observation. Le processus lit la première observation du premier jeu de données, puis la première du second, et ainsi de suite. Le jeu de données de sortie résultant contient toutes les variables de tous les jeux de données d'entrée. Le DATA step cesse de sélectionner des observations une fois que le jeu de données ayant le plus petit nombre d'observations est entièrement lu. Pour combiner des jeux de données avec un nombre inégal d'observations en accédant directement et en faisant correspondre les observations par une variable commune, l'option POINT= peut être utilisée.
Analyse des données

Type : CREATION_INTERNE


Les exemples utilisent des données générées (datalines) pour créer les jeux de données 'animal' et 'plantG' avant leur combinaison.

1 Bloc de code
DATA STEP Data
Explication :
Ce code SAS crée deux jeux de données temporaires, 'animal' et 'plantG', avec des données internes. Ensuite, il combine ces deux jeux de données en utilisant deux instructions SET consécutives dans un nouveau jeu de données nommé 'combine'. Chaque observation du jeu de données 'animal' est lue, puis chaque observation correspondante (par ordre de lecture) du jeu de données 'plantG' est lue. En cas de variable commune ('common'), la valeur du dernier jeu de données (ici 'plantG') écrase celle du précédent. La Proc PRINT affiche le contenu du jeu de données 'combine'.
Copié !
1DATA animal;
2 INPUT common $ animal $;
3 DATALINES;
4a Ant
5b Bird
6c Cat
7d Dog
8e Eagle
9f Frog
10;
11RUN;
12 
13DATA plantG;
14 INPUT common $ plant $;
15 DATALINES;
16a Apple
17b Banana
18c Coconut
19d Dewberry
20e Eggplant
21g Fig
22;
23RUN;
24 
25DATA combine;
26 SET animal;
27 SET plantG;
28RUN;
29 
30PROC PRINT DATA=combine; RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Copyright © SAS Institute Inc. All Rights Reserved


Banner
Le Conseil de l'Expert
Expert
Stéphanie
Spécialiste Machine Learning et IA.
« Cette technique est idéale pour ajouter des "constantes" ou des paramètres stockés dans une table d'une seule ligne à une table de données volumineuse. Si vous l'utilisez pour fusionner des fichiers de données, assurez-vous d'utiliser l'option RENAME= (ex: set plantG(rename=(common=common_plant));) pour ne perdre aucune information lors de la superposition. »