Publié le :

Conserver des Variables dans une Étape DATA CAS

Ce code est également disponible en : Deutsch English Español
En attente de validation
L'instruction `KEEP` permet de spécifier explicitement les variables à inclure dans le nouvel ensemble de données créé par l'étape DATA. Toutes les autres variables sont automatiquement exclues. Il est crucial de noter que, lorsque l'étape DATA est exécutée dans l'environnement CAS, l'option `WHERE=` ne peut être appliquée que sur l'ensemble de données en entrée (dans l'instruction `SET`). Tenter d'utiliser `WHERE=` dans l'instruction `DATA` elle-même (par exemple, `data mycas.table(where=...);`) entraînera une erreur. Ceci est une distinction importante par rapport à l'exécution de l'étape DATA en SAS© traditionnel. Les instructions `DROP` et `KEEP` sont toutes deux prises en charge dans une étape DATA CAS.
Analyse des données

Type : CREATION_INTERNE


Les exemples utilisent des données générées via DATALINES ou des ensembles de données SASHELP, assurant l'autonomie de chaque script.

1 Bloc de code
DATA STEP
Explication :
Cet exemple illustre l'utilisation basique de l'instruction `KEEP` dans une étape `DATA` s'exécutant sur CAS. Il charge d'abord l'ensemble de données `sashelp.cars` dans la bibliothèque `mycas` (située sur CAS), puis crée un nouvel ensemble de données `mycas.bigcars`. La clause `WHERE=(Weight > 6000)` est appliquée sur l'ensemble de données en entrée (`mycas.cars`) pour filtrer les observations, et l'instruction `KEEP Make Model Type;` garantit que seules les variables 'Make', 'Model' et 'Type' sont incluses dans `mycas.bigcars`. La table est ensuite affichée et nettoyée.
Copié !
1LIBNAME mycas cas;
2 
3/* Charger l'ensemble de données Sashelp.Cars dans CAS */
4DATA mycas.cars;
5 SET sashelp.cars;
6RUN;
7 
8/* Filtrer les voitures de gros poids et conserver un sous-ensemble de variables */
9DATA mycas.bigcars;
10 SET mycas.cars(where=(Weight > 6000));
11 keep Make Model Type;
12RUN;
13 
14/* Afficher le résultat */
15PROC PRINT DATA=mycas.bigcars;
16RUN;
17 
18/* Nettoyer les tables CAS temporaires */
19PROC CAS;
20 TABLE.dropTable / caslib='CASUSER' name='cars';
21 TABLE.dropTable / caslib='CASUSER' name='bigcars';
22RUN;
23QUIT;
2 Bloc de code
DATA STEP Data
Explication :
Cet exemple montre une utilisation intermédiaire de `KEEP` avec une petite transformation. Une table `mycas.produits` est créée directement sur CAS à l'aide de `DATALINES`. Une deuxième étape `DATA` calcule `TotalValeur` pour chaque produit (`Prix * Quantite`), puis l'instruction `KEEP` est utilisée pour ne conserver que les variables 'Produit', 'Prix', 'Quantite' et la nouvelle variable calculée 'TotalValeur'. La table est ensuite affichée et nettoyée.
Copié !
1LIBNAME mycas cas;
2 
3/* Création d'une table CAS simple avec DATALINES */
4DATA mycas.produits;
5 INPUT ID Produit $ Prix Quantite;
6 DATALINES;
71 Ordinateur 1200 5
82 Souris 25 50
93 Clavier 75 30
104 Ecran 300 10
115 Imprimante 150 15
12;
13RUN;
14 
15/* Calculer la valeur totale et conserver les variables pertinentes */
16DATA mycas.stock_valeur;
17 SET mycas.produits;
18 TotalValeur = Prix * Quantite;
19 keep Produit Prix Quantite TotalValeur;
20RUN;
21 
22/* Afficher le résultat */
23PROC PRINT DATA=mycas.stock_valeur;
24RUN;
25 
26/* Nettoyer les tables CAS temporaires */
27PROC CAS;
28 TABLE.dropTable / caslib='CASUSER' name='produits';
29 TABLE.dropTable / caslib='CASUSER' name='stock_valeur';
30RUN;
31QUIT;
3 Bloc de code
DATA STEP
Explication :
Cet exemple explore un cas plus avancé de l'instruction `KEEP` avec une logique conditionnelle. Il charge `sashelp.class` sur CAS. Ensuite, il tente de conserver différentes variables en fonction du sexe de l'étudiant. Si le sexe est 'M', seules 'Name' et 'Age' sont conservées; sinon, 'Name', 'Height' et 'Weight' le sont. Bien que `KEEP` dans un bloc `DO` puisse avoir un comportement subtil (seules les variables explicitement nommées dans un `KEEP` ou `DROP` global sont initialement considérées, et les autres sont gérées par la portée), l'intention ici est de montrer une tentative de sélection dynamique. Pour une robustesse accrue dans des scénarios de sortie hétérogènes, des approches avec `DROP` ou `RENAME` combinées à des logiques plus explicites seraient préférables. La table est ensuite affichée et nettoyée.
Copié !
1LIBNAME mycas cas;
2 
3/* Charger l'ensemble de données Sashelp.Class dans CAS */
4DATA mycas.etudiants;
5 SET sashelp.class;
6RUN;
7 
8/* Conserver différentes variables selon une condition */
9DATA mycas.resultat_etudiants;
10 SET mycas.etudiants;
11 IF Sex = 'M' THEN DO;
12 keep Name Age;
13 END;
14 ELSE DO;
15 keep Name Height Weight;
16 END;
17RUN;
18 
19/* Afficher le résultat (Note: le comportement de KEEP dans les blocs conditionnels peut être complexe.
20 SAS s'attend à ce que toutes les variables 'kept' soient définies globalement ou que le comportement
21 soit géré par des instructions 'DROP' pour être plus explicite. Cet exemple est simplifié pour illustrer.
22 Dans un cas réel, une approche avec DROP/RENAME serait plus robuste pour des sorties hétérogènes.) */
23PROC PRINT DATA=mycas.resultat_etudiants;
24RUN;
25 
26/* Nettoyer les tables CAS temporaires */
27PROC CAS;
28 TABLE.dropTable / caslib='CASUSER' name='etudiants';
29 TABLE.dropTable / caslib='CASUSER' name='resultat_etudiants';
30RUN;
31QUIT;
4 Bloc de code
DATA STEP Data
Explication :
Cet exemple illustre l'utilisation de `KEEP` dans une étape `DATA` qui s'exécute entièrement sur l'environnement Cloud Analytic Services (CAS). Une table `mycas.vente_regionale` est créée directement sur CAS à partir de données en ligne (`DATALINES`). L'option `promote=yes` assure que cette table est rendue persistante au sein de la session CAS. Une deuxième étape `DATA` traite cette table CAS, en appliquant un filtre (`WHERE=(Revenu > 50000)`) sur l'ensemble de données d'entrée CAS et en utilisant l'instruction `KEEP` pour sélectionner spécifiquement les variables 'Region', 'Produit' et 'Revenu' pour la table de sortie `mycas.vente_details_filtre`, qui est également une table CAS. Cela démontre le traitement en mémoire distribuée et la sélection de variables via `KEEP` dans un contexte CAS natif. Les tables sont ensuite affichées et nettoyées.
Copié !
1LIBNAME mycas cas;
2 
3/* Création d'une table CAS simple directement dans CAS à partir de DATALINES */
4/* Cela garantit que la table est nativement CAS pour l'exemple. */
5DATA mycas.vente_regionale (promote=yes); /* promote=yes rend la table persistante dans la session CAS */
6 INPUT Region $ Produit $ UnitesVendues Revenu;
7 DATALINES;
8Nord Ordinateur 100 120000
9Sud Souris 250 6250
10Est Clavier 150 11250
11Ouest Ecran 50 15000
12Nord Imprimante 75 11250
13Sud Ordinateur 80 96000
14;
15RUN;
16 
17/* Traiter la table CAS avec l'étape DATA CAS, filtrer et conserver des variables */
18/* L'étape DATA s'exécute sur CAS car l'entrée et la sortie sont des tables CAS. */
19DATA mycas.vente_details_filtre;
20 SET mycas.vente_regionale (where=(Revenu > 50000)); /* Filtrage sur la table CAS */
21 keep Region Produit Revenu; /* Conserver seulement ces variables */
22RUN;
23 
24/* Afficher le résultat de la table traitée sur CAS */
25PROC PRINT DATA=mycas.vente_details_filtre;
26RUN;
27 
28/* Nettoyer les tables CAS temporaires de la session */
29PROC CAS;
30 SESSION casauto;
31 TABLE.dropTable / caslib='CASUSER' name='vente_regionale';
32 TABLE.dropTable / caslib='CASUSER' name='vente_details_filtre';
33RUN;
34QUIT;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Copyright © SAS Institute Inc. All Rights Reserved.