Jointures CAS avec Deep Learning et Search Analytics

Ce code est également disponible en : Deutsch English Español
Niveau de difficulté
Débutant
Publié le :
Attention : Ce code nécessite des droits administrateur.
Le script commence par établir une connexion CAS et assigner toutes les bibliothèques CAS. Il crée ensuite deux tables CAS, 'casuser.baseball_location' et 'casuser.baseball_stats', en sélectionnant et en manipulant des colonnes de la table source 'sashelp.baseball'. La session CAS active est ensuite définie sur 'casuser'. Enfin, il charge les ensembles d'actions 'searchAnalytics' et 'deepLearn' et exécute des exemples d'actions 'dlJoin' et 'searchJoin' pour démontrer des opérations de jointure de type 'APPEND' sur les tables créées, produisant les tables 'dlJoin' et 'searchJoin' dans CAS.
Analyse des données

Type : SASHELP


Les données source initiales proviennent de la bibliothèque standard SASHELP ('sashelp.baseball'). Deux nouvelles tables ('casuser.baseball_location' et 'casuser.baseball_stats') sont créées dans la bibliothèque CAS 'CASUSER' à partir de cette source.

1 Bloc de code
CAS
Explication :
Ce bloc initialise une session CAS (Cloud Analytic Services) et assigne toutes les bibliothèques CAS disponibles à l'utilisateur. C'est une opération d'administration courante qui rend les bibliothèques accessibles pour les opérations de données.
Copié !
1cas;
2caslib _all_ assign;
2 Bloc de code
DATA STEP Data
Explication :
Ce DATA STEP crée une nouvelle table CAS nommée 'baseball_location' dans la bibliothèque 'CASUSER'. Il sélectionne des colonnes spécifiques ('name', 'team', 'div', 'division', 'league', 'position') de la table source 'sashelp.baseball', en ne conservant que les informations de localisation et d'équipe des joueurs.
Copié !
1DATA casuser.baseball_location;
2 SET sashelp.baseball;
3 keep name team div division league position;
4RUN;
3 Bloc de code
DATA STEP Data
Explication :
Ce DATA STEP crée une autre table CAS nommée 'baseball_stats' dans la bibliothèque 'CASUSER'. Il est également basé sur 'sashelp.baseball', mais cette fois, il supprime les colonnes de localisation et d'équipe, ne conservant que les statistiques des joueurs, pour préparer une jointure ultérieure.
Copié !
1DATA casuser.baseball_stats;
2 SET sashelp.baseball;
3 drop div division league position ;
4RUN;
4 Bloc de code
SAS GLOBAL
Explication :
Cette instruction 'options' définit la bibliothèque CAS par défaut ('caslib') sur 'casuser'. Cela signifie que toutes les opérations CAS ultérieures qui ne spécifient pas explicitement une caslib utiliseront 'casuser'.
Copié !
1options caslib=casuser;
5 Bloc de code
PROC CAS
Explication :
Ce bloc 'PROC CAS' est utilisé pour charger des ensembles d'actions (action sets) spécifiques nécessaires aux opérations suivantes. Il charge 'searchAnalytics' et 'deepLearn', qui contiennent des actions pour des analyses avancées et des jointures spécifiques aux contextes de recherche et d'apprentissage profond.
Copié !
1PROC CAS;
2LOADACTIONSET 'searchAnalytics';
3LOADACTIONSET 'deepLearn';
4QUIT;
6 Bloc de code
PROC CAS Data
Explication :
Ce bloc 'PROC CAS' exécute l'action 'dlJoin' de l'ensemble d'actions 'deepLearn'. Il effectue une jointure de type 'APPEND' (ajout des lignes) entre 'baseball_location' (table annotée) et 'baseball_stats' (table principale). Le résultat est une nouvelle table CAS nommée 'dlJoin', remplaçant toute table existante du même nom.
Copié !
1PROC CAS;
2 DEEPLEARN.dlJoin /
3 joinType="APPEND"
4 annotatedTable={name="baseball_location"}
5 casOut={name="dlJoin", replace=TRUE}
6 TABLE={name="baseball_stats"};
7 RUN;
8QUIT;
7 Bloc de code
PROC CAS Data
Explication :
Ce bloc 'PROC CAS' utilise l'action 'searchJoin' de l'ensemble d'actions 'searchAnalytics'. Il réalise également une jointure de type 'APPEND' en utilisant 'baseball_location' comme table de gauche et 'baseball_stats' comme table de droite. Le résultat est stocké dans une nouvelle table CAS nommée 'searchJoin', remplaçant toute table existante.
Copié !
1PROC CAS;
2 searchAnalytics.searchJoin /
3 joinType="APPEND"
4 casOut={name="searchJoin", replace=TRUE}
5 leftTable={
6 TABLE={name="baseball_location"}
7 }
8 rightTable={
9 TABLE={name="baseball_stats"}
10 };
11RUN;
12QUIT;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Copyright © 2021, SAS Institute Inc., Cary, NC, USA. All Rights Reserved. SPDX-License-Identifier: Apache-2.0


Documentation liée

Aucune documentation spécifique pour cette catégorie.