Publié le :
ETL CREATION_INTERNE

Traitement et consolidation de données de départements

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script commence par la création du jeu de données `research_development`. Les variables `project`, `Department`, `Manager` et `Staff_count` sont définies, et leurs valeurs sont renseignées directement dans le script via une section `Datalines`. Un premier `PROC PRINT` est exécuté pour afficher le contenu initial de `research_development`.
Ensuite, un second jeu de données nommé `Publication` est créé de manière similaire, avec les mêmes variables et des données fournies également via `Datalines`. Ce jeu de données `Publication` est ensuite trié par la variable `project` à l'aide de `PROC SORT`, et le résultat est sauvegardé dans un nouveau jeu de données nommé `publication`.
Finalement, les données du jeu de données `publication` (trié) sont ajoutées à la fin du jeu de données `research_development` à l'aide de `PROC APPEND`, ce qui réalise une consolidation des deux sources de données. Un dernier `PROC PRINT` affiche le contenu du jeu de données `research_development` consolidé. Les références de fichiers incluses dans les instructions `Input` sont considérées comme des annotations non standard pour ce type de lecture de données et sont ignorées dans l'analyse fonctionnelle du code SAS© lui-même, la donnée étant fournie par `Datalines`.
Analyse des données

Type : CREATION_INTERNE


Les deux jeux de données, `research_development` et `Publication`, sont entièrement créés à l'intérieur du script en utilisant des blocs `DATA` et des déclarations `DATALINES`. Aucune donnée externe ou de bibliothèques SAS comme SASHELP n'est utilisée comme source initiale pour ces jeux de données.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc `DATA STEP` crée le jeu de données `research_development`. Il définit les variables `project` (caractère, longueur 5), `Department` (caractère, longueur 10), `Manager` (caractère, longueur 9) et `Staff_count` (numérique, longueur 2). Les données sont lues à partir des lignes fournies dans la section `Datalines` suivante. Les références `@code_sas_json/...` et `@code_sas/...` dans l'instruction `Input` sont des annotations non standard et ne font pas partie de la syntaxe SAS pour la lecture des données via `Datalines`. Elles sont ignorées pour l'exécution du code SAS.
Copié !
1DATA research_development;
2LENGTH Department $ 10;
3INPUT
4 @code_sas_json/HW5-1.json project $5.
5 @code_sas_json/testmakro6.json Department $10.
6 @code_sas_json/Activity 17.json Manager $9.
7 @code_sas/slc_voodoo20251126.sas Staff_count 2.;
8DATALINES;
9MP971 Designing Daugherty10
10MP971 Coding Newton 8
11MP971 Testing Miller 7
12SL827 Designing Ramirez 8
13SL827 Coding Cho 10
14SL827 Testing Baker 7
15WP057 Designing Hascal 11
16WP057 Coding Constant 13
17WP057 Testing Slivko 10
18;
2 Bloc de code
PROC PRINT
Explication :
Cette procédure `PROC PRINT` affiche le contenu du jeu de données `research_development` dans la sortie SAS, avec le titre 'Research dept'.
Copié !
1 
2PROC PRINT
3DATA=research_development;
4title 'Research dept';
5 
6RUN;
7 
3 Bloc de code
DATA STEP Data
Explication :
Ce bloc `DATA STEP` crée le jeu de données `Publication`. Il définit les mêmes variables (`project`, `Department`, `Manager`, `Staff_count`) que précédemment, avec leurs longueurs et types. Les données sont également lues à partir des lignes fournies dans la section `Datalines` suivante. Les références `@code_sas_json/...` et `@code_sas/...` sont des annotations non standard et sont ignorées pour l'exécution du code SAS.
Copié !
1DATA Publication;
2INPUT
3 @code_sas_json/hsdua2304@gmail.com_SAS_Assignment_1.json project $5.
4 @code_sas_json/seqdx12.json Department $10.
5 @code_sas_json/HW5-1.json Manager $9.
6 @code_sas/regneark_med_flere_faner - DK - 20221129.sas Staff_count 2.;
7DATALINES;
8Cook Writing WP057 5
9Deakins Writing SL827 7
10Franscombe Editing MP971 4
11Henry Editing WP057 3
12King Production SL827 5
13Krysonski Production WP057 3
14Lassiter Graphics SL827 3
15Miedema Editing SL827 5
16Morard Writing MP971 6
17Posey Production MP971 4
18Spackle Graphics WP057 2
19;
4 Bloc de code
PROC SORT
Explication :
Cette procédure `PROC SORT` trie le jeu de données `Publication` par ordre croissant selon la variable `project`. Le résultat du tri est sauvegardé dans un nouveau jeu de données nommé `publication`.
Copié !
1 
2PROC SORT
3DATA = Publication out = publication;
4BY project;
5RUN;
6 
5 Bloc de code
PROC APPEND
Explication :
Cette procédure `PROC APPEND` ajoute toutes les observations du jeu de données `publication` (qui est le résultat du tri) à la fin du jeu de données `research_development`. Cela consolide les informations des deux sources de données.
Copié !
1 
2PROC APPEND base=research_development
3DATA= publication;
4RUN;
5 
6 Bloc de code
PROC PRINT
Explication :
Cette procédure `PROC PRINT` affiche le contenu final et consolidé du jeu de données `research_development` après l'ajout des données de `Publication`. Le titre de la sortie est 'Publication and research dept'.
Copié !
1 
2PROC PRINT
3DATA=research_development;
4title 'Publication and research dept';
5 
6RUN;
7 
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.