Cette fonctionnalité combine des observations de deux ou plusieurs jeux de données en les associant positionnellement. L'instruction SET lit une observation de chaque jeu de données listé à chaque itération du DATA step. Les variables communes aux jeux de données sont écrasées par les valeurs du jeu de données spécifié en dernier dans l'instruction SET. Le processus s'arrête une fois que le jeu de données contenant le moins d'observations a été entièrement lu, ce qui détermine le nombre final d'observations dans le jeu de données résultant. Cette méthode ne repose pas sur une variable clé pour l'appariement et peut produire des résultats inattendus si les jeux de données ont des variables communes avec des valeurs non synchronisées.
Analyse des données
Type : CREATION_INTERNE
Les exemples utilisent des données générées (datalines) ou SASHELP. Les jeux de données 'animal' et 'plantG' sont créés en interne pour l'illustration.
1 Bloc de code
DATA STEP / PROC PRINT Data
Explication : Ce code SAS crée deux jeux de données, 'animal' et 'plantG', puis les combine à l'aide de deux instructions SET consécutives. Le DATA step lit une observation de 'animal' puis une observation de 'plantG' pour chaque itération. Les valeurs de la variable 'common' du jeu de données 'plantG' (spécifié en dernier) écrasent celles du jeu de données 'animal'. Le jeu de données 'combine' résultant aura un nombre d'observations égal à celui du plus petit des jeux de données d'entrée. La sortie PROC PRINT montre le jeu de données combiné, illustrant comment les valeurs de 'common' de 'plantG' ont été conservées, même en cas de divergence à la sixième observation (où 'animal' avait 'f' et 'plantG' avait 'g', le 'g' de 'plantG' est retenu).
Copié !
data animal;
input common $ animal $;
datalines;
a Ant
b Bird
c Cat
d Dog
e Eagle
f Frog
;
run;
data plantG;
input common $ plant $;
datalines;
a Apple
b Banana
c Coconut
d Dewberry
e Eggplant
g Fig
;
run;
data combine;
set animal;
set plantG;
run;
proc print data=combine; run;
1
DATA animal;
2
INPUT common $ animal $;
3
DATALINES;
4
a Ant
5
b Bird
6
c Cat
7
d Dog
8
e Eagle
9
f Frog
10
;
11
RUN;
12
13
DATA plantG;
14
INPUT common $ plant $;
15
DATALINES;
16
a Apple
17
b Banana
18
c Coconut
19
d Dewberry
20
e Eggplant
21
g Fig
22
;
23
RUN;
24
25
DATA combine;
26
SET animal;
27
SET plantG;
28
RUN;
29
30
PROC PRINTDATA=combine; RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
« Utilisez cette méthode principalement pour ajouter des variables globales (comme des constantes ou des moyennes calculées au préalable) à chaque ligne d'une table principale. Pour toute autre forme de combinaison de données, privilégiez le MERGE avec une instruction BY, qui offre une sécurité bien supérieure contre les décalages de lignes accidentels. »
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.