Veröffentlicht am :
ETL SASHELP

Partitionierung und Sortierung im DATA Step unter CAS

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Dieses Skript konfiguriert eine CAS-Sitzung und lädt die Tabelle SASHELP.BASEBALL in den CAS-Speicher. Es zeigt die Verwendung der Dataset-Optionen 'partition=' und 'orderby=', um die Daten physisch auf den Rechenknoten zu organisieren, was spätere gruppenweise Verarbeitungen (BY) optimiert. Ein zweiter DATA Step veranschaulicht diese Verwendung mit einer kumulativen Zählerberechnung (RETAIN) pro Team.
Datenanalyse

Type : SASHELP


Die Quelldaten stammen aus der Standardbibliothek SASHELP (Tabelle BASEBALL).

1 Codeblock
CONFIGURATION
Erklärung :
Initialisierung der CAS-Verbindung. Erstellt ein Libref 'CASWORK', das auf die Caslib 'casuser' verweist, definiert es als Standardbibliothek (USER) und weist alle sichtbaren Caslibs zu.
Kopiert!
1LIBNAME CASWORK cas caslib=casuser;
2options USER = CASWORK;
3caslib _all_ assign;
4%put &_sessref_;
2 Codeblock
DATA STEP Data
Erklärung :
Erstellung einer partitionierten und sortierten CAS-Tabelle. Die Option 'partition' verteilt die Daten nach Division und Zeilenreihenfolge, und 'orderby' stellt die Sortierung innerhalb der Partitionen sicher, was zukünftige Zugriffe optimiert.
Kopiert!
1DATA caswork.baseball(partition=(div row_order) orderby=(div row_order));
2 SET sashelp.baseball;
3 row_order = _n_;
4RUN;
3 Codeblock
DATA STEP Data
Erklärung :
Datenverarbeitung nach Gruppe (BY DIV TEAM). Berechnet einen sequenziellen Zähler für jedes Team unter Verwendung der RETAIN-Anweisung und der automatischen Variable first.team.
Kopiert!
1DATA caswork.baseball2;
2 SET caswork.baseball;
3 retain count;
4 BY DIV TEAM;
5 IF first.team THEN
6 count=0;
7 count+1;
8RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Copyright © 2021, SAS Institute Inc., Cary, NC, USA. All Rights Reserved. SPDX-License-Identifier: Apache-2.0