Publicado el :
Manipulación de Datos CREATION_INTERNE

Ejemplos: Entrelazar Datos

Este código también está disponible en: Deutsch English Français
En espera de validación
El entrelazado de conjuntos de datos SAS© es una técnica que permite combinar observaciones de varios conjuntos de datos en uno solo, respetando el orden definido por una o más variables comunes especificadas en la instrucción BY. Para garantizar un entrelazado correcto, es imperativo que todos los conjuntos de datos de entrada estén previamente ordenados (utilizando PROC SORT) o indexados según la misma variable o las mismas variables BY. El proceso copia las observaciones de los conjuntos de datos originales en el conjunto de datos de salida, manteniendo el orden secuencial de los valores de la variable BY. Si los valores de la variable BY están duplicados entre los conjuntos de datos de entrada, el orden en que los conjuntos de datos se enumeran en la instrucción SET determinará el orden de las observaciones correspondientes en la salida. Si un conjunto de datos de entrada contiene variables no presentes en los otros, los valores correspondientes en el conjunto de datos de salida serán nulos. El número total de observaciones en el conjunto de datos de salida corresponde a la suma de las observaciones de todos los conjuntos de datos de entrada.
Análisis de datos

Type : CREATION_INTERNE


Los ejemplos utilizan datos generados (datalines) para crear los conjuntos de datos SAS necesarios para la demostración del entrelazado.

1 Bloque de código
DATA STEP / PROC SORT Data
Explicación :
Este ejemplo crea dos conjuntos de datos, 'animal' y 'plant', y los ordena por la variable común 'common'. Luego, el paso DATA entrelaza estos conjuntos de datos utilizando la instrucción BY. El conjunto de datos de salida 'interleave' contiene las observaciones de ambos conjuntos de datos, ordenadas por 'common'.
¡Copiado!
1DATA animal;
2 INPUT common $ animal $;
3 DATALINES;
4a Ant
5b Bird
6c Cat
7d Dog
8e Eagle
9f Frog
10;
11RUN;
12 
13DATA plant;
14 INPUT common $ plant $;
15 DATALINES;
16a Apple
17b Banana
18c Coconut
19d Dewberry
20e Eggplant
21f Fig
22;
23RUN;
24 
25PROC SORT DATA=animal; BY common; RUN;
26PROC SORT DATA=plant; BY common; RUN;
27 
28DATA interleave;
29 SET animal plant;
30 BY common;
31RUN;
32PROC PRINT DATA=interleave; RUN;
2 Bloque de código
DATA STEP / PROC SORT Data
Explicación :
Este ejemplo demuestra el entrelazado de conjuntos de datos ('animalDupes' y 'plantDupes') que contienen valores duplicados para la variable BY 'common'. Los conjuntos de datos se ordenan antes del entrelazado. El orden de los conjuntos de datos en la instrucción SET influye en el orden de las observaciones con los mismos valores de 'common' en el conjunto de datos de salida. Se proporciona un ejemplo adicional con el orden 'plantDupes animalDupes' para ilustrar este impacto.
¡Copiado!
1DATA animalDupes;
2 INPUT common $ animal $;
3 DATALINES;
4a Ant
5a Ape
6b Bird
7c Cat
8d Dog
9e Eagle
10;
11RUN;
12 
13DATA plantDupes;
14 INPUT common $ plant $;
15 DATALINES;
16a Apple
17b Banana
18c Coconut
19c Celery
20d Dewberry
21e Eggplant
22;
23RUN;
24 
25PROC SORT DATA=animalDupes; BY common; RUN;
26PROC SORT DATA=plantDupes; BY common; RUN;
27 
28DATA interleave;
29 SET animalDupes plantDupes;
30 BY common;
31RUN;
32 
33PROC PRINT DATA=interleave; RUN;
3 Bloque de código
DATA STEP / PROC SORT Data
Explicación :
Este ejemplo ilustra el entrelazado de conjuntos de datos ('animalDupes' y 'plantMissing2') donde la variable BY 'common' contiene valores presentes en un conjunto de datos pero no en el otro (por ejemplo, 'd' en 'animalDupes' y 'f' en 'plantMissing2'). Después de ordenar, el paso DATA entrelaza los conjuntos de datos. Las variables que no están presentes en una observación específica de un conjunto de datos de entrada reciben valores perdidos en el conjunto de datos de salida.
¡Copiado!
1DATA animalDupes;
2 INPUT common $ animal $;
3 DATALINES;
4a Ant
5a Ape
6b Bird
7c Cat
8d Dog
9e Eagle
10;
11RUN;
12 
13DATA plantMissing2;
14 INPUT common $ plant $;
15 DATALINES;
16a Apple
17b Banana
18c Coconut
19e Eggplant
20f Fig
21;
22RUN;
23 
24PROC SORT DATA=animalDupes; BY common; RUN;
25PROC SORT DATA=plantMissing2; BY common; RUN;
26 
27DATA interleave;
28 SET animalDupes plantMissing2;
29 BY common;
30RUN;
31 
32PROC PRINT DATA=interleave; RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : Copyright © SAS Institute Inc. All Rights Reserved