CAS-Joins mit Deep Learning und Search Analytics

Dieser Code ist auch verfügbar auf: English Español Français
Schwierigkeitsgrad
Anfänger
Veröffentlicht am :
Attention : Dieser Code erfordert Administratorrechte.
Das Skript beginnt mit dem Aufbau einer CAS-Verbindung und der Zuweisung aller verfügbaren CAS-Bibliotheken. Anschließend werden zwei CAS-Tabellen, 'casuser.baseball_location' und 'casuser.baseball_stats', erstellt, indem Spalten aus der Quelltabelle 'sashelp.baseball' ausgewählt und bearbeitet werden. Die aktive CAS-Sitzung wird dann auf 'casuser' gesetzt. Schließlich werden die Actionsets 'searchAnalytics' und 'deepLearn' geladen, und es werden Beispiele der Aktionen 'dlJoin' und 'searchJoin' ausgeführt, um 'APPEND'-Join-Operationen auf den erstellten Tabellen zu demonstrieren, wodurch die Tabellen 'dlJoin' und 'searchJoin' in CAS erzeugt werden.
Datenanalyse

Type : SASHELP


Die ursprünglichen Quelldaten stammen aus der Standardbibliothek SASHELP ('sashelp.baseball'). Zwei neue Tabellen ('casuser.baseball_location' und 'casuser.baseball_stats') werden in der CAS-Bibliothek 'CASUSER' aus dieser Quelle erstellt.

1 Codeblock
CAS
Erklärung :
Dieser Block initialisiert eine CAS-Sitzung (Cloud Analytic Services) und weist dem Benutzer alle verfügbaren CAS-Bibliotheken zu. Dies ist eine gängige Verwaltungsoperation, die die Bibliotheken für Datenoperationen zugänglich macht.
Kopiert!
1cas;
2caslib _all_ assign;
2 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP erstellt eine neue CAS-Tabelle namens 'baseball_location' in der Bibliothek 'CASUSER'. Er wählt spezifische Spalten ('name', 'team', 'div', 'division', 'league', 'position') aus der Quelltabelle 'sashelp.baseball' aus und behält nur die Standort- und Teaminformationen der Spieler bei.
Kopiert!
1DATA casuser.baseball_location;
2 SET sashelp.baseball;
3 keep name team div division league position;
4RUN;
3 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP erstellt eine weitere CAS-Tabelle namens 'baseball_stats' in der Bibliothek 'CASUSER'. Er basiert ebenfalls auf 'sashelp.baseball', löscht diesmal jedoch die Standort- und Teamspalten und behält nur die Spielerstatistiken bei, um eine spätere Verknüpfung vorzubereiten.
Kopiert!
1DATA casuser.baseball_stats;
2 SET sashelp.baseball;
3 drop div division league position ;
4RUN;
4 Codeblock
SAS GLOBAL
Erklärung :
Diese 'options'-Anweisung setzt die Standard-CAS-Bibliothek ('caslib') auf 'casuser'. Das bedeutet, dass alle nachfolgenden CAS-Operationen, die keine caslib explizit angeben, 'casuser' verwenden werden.
Kopiert!
1options caslib=casuser;
5 Codeblock
PROC CAS
Erklärung :
Dieser 'PROC CAS'-Block wird verwendet, um spezifische Actionsets zu laden, die für die folgenden Operationen erforderlich sind. Er lädt 'searchAnalytics' und 'deepLearn', die Aktionen für erweiterte Analysen und spezifische Joins in den Kontexten von Suche und Deep Learning enthalten.
Kopiert!
1PROC CAS;
2LOADACTIONSET 'searchAnalytics';
3LOADACTIONSET 'deepLearn';
4QUIT;
6 Codeblock
PROC CAS Data
Erklärung :
Dieser 'PROC CAS'-Block führt die Aktion 'dlJoin' aus dem Actionset 'deepLearn' aus. Er führt eine 'APPEND'-Join-Operation (Anhängen von Zeilen) zwischen 'baseball_location' (kommentierte Tabelle) und 'baseball_stats' (Haupttabelle) durch. Das Ergebnis ist eine neue CAS-Tabelle namens 'dlJoin', die jede bestehende Tabelle gleichen Namens ersetzt.
Kopiert!
1PROC CAS;
2 DEEPLEARN.dlJoin /
3 joinType="APPEND"
4 annotatedTable={name="baseball_location"}
5 casOut={name="dlJoin", replace=TRUE}
6 TABLE={name="baseball_stats"};
7 RUN;
8QUIT;
7 Codeblock
PROC CAS Data
Erklärung :
Dieser 'PROC CAS'-Block verwendet die Aktion 'searchJoin' aus dem Actionset 'searchAnalytics'. Er führt ebenfalls eine 'APPEND'-Join-Operation durch, wobei 'baseball_location' als linke Tabelle und 'baseball_stats' als rechte Tabelle verwendet wird. Das Ergebnis wird in einer neuen CAS-Tabelle namens 'searchJoin' gespeichert, die jede bestehende Tabelle ersetzt.
Kopiert!
1PROC CAS;
2 searchAnalytics.searchJoin /
3 joinType="APPEND"
4 casOut={name="searchJoin", replace=TRUE}
5 leftTable={
6 TABLE={name="baseball_location"}
7 }
8 rightTable={
9 TABLE={name="baseball_stats"}
10 };
11RUN;
12QUIT;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Copyright © 2021, SAS Institute Inc., Cary, NC, USA. All Rights Reserved. SPDX-License-Identifier: Apache-2.0


Zugehörige Dokumentation

Aucune documentation spécifique pour cette catégorie.