Veröffentlicht am :

Lesen einer ORC-Tabelle aus ADLS

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Dieses Beispiel veranschaulicht das Lesen einer ORC-Tabelle, die in Azure Data Lake Storage Gen2 gespeichert ist. Um auf von Hive erstellte und als Verzeichnisse gespeicherte Tabellen zugreifen zu können, muss die Option DIRECTORIES_AS_DATA=YES in der LIBNAME-Anweisung angegeben werden. Der vorliegende SAS©-Code liest eine 'inventory'-Tabelle, die zuvor in Hive erstellt wurde.
Datenanalyse

Type : EXTERNAL


Das SAS-Beispiel liest eine 'inventory'-Tabelle im ORC-Format, die zuvor in Azure ADLS erstellt werden muss. Die Hive-Befehle zur Erstellung dieser Tabelle werden als Voraussetzung im ersten Codeblock bereitgestellt. Das SAS-Beispiel erstellt intern keine eigenen Daten.

1 Codeblock
HiveQL Data
Erklärung :
Dieser HiveQL-Codeblock ist eine Voraussetzung für das SAS-Beispiel. Er erstellt eine Tabelle namens 'inventory' im ORC-Format im Pfad '/mydata/inventory' von Azure ADLS und fügt einige Datensätze ein. Diese Tabelle wird anschließend vom SAS-Code gelesen. Dieser Code muss in einer geeigneten Hive-Umgebung ausgeführt werden, bevor der SAS-Code ausgeführt wird.
Kopiert!
1CREATE TABLE inventory(item INT, descr CHAR(32), price DOUBLE, day DATE) STORED AS ORC LOCATION '/mydata/inventory';
2INSERT INTO inventory VALUES(4600, 'incandescent A19', 15.54, '2019-10-17');
3INSERT INTO inventory VALUES(1023, 'led A19', 14.97, '2019-10-17');
4INSERT INTO inventory VALUES(1023, 'incandescent B10', 5.49, '2019-10-16');
5INSERT INTO inventory VALUES(4219, 'incandescent E12', 3.97, '2019-10-15');
6SELECT * FROM inventory;
2 Codeblock
LIBNAME ORC
Erklärung :
Diese LIBNAME-Anweisung `mylib` verbindet SAS mit einem Azure Data Lake Storage (ADLS)-Speicherort unter Verwendung der ORC-Engine. Sie gibt den Namen des Speicherkontos (`storage_account_name`), die Anwendungs-ID des Speichers (`storage_application_id`) und das Dateisystem des Speichers (`storage_file_system`) an. Die Option `directories_as_data=yes` ist unerlässlich, damit SAS Hive-Tabellen, die als Verzeichnisse in ADLS gespeichert sind, erkennt und darauf zugreifen kann. Schließlich wird die PROC PRINT-Prozedur verwendet, um den Inhalt der ORC-Tabelle `mylib.inventory` anzuzeigen.
Kopiert!
1LIBNAME mylib orc '/data/user' /*1*/
2 storage_account_name = myacct
3 storage_application_id = 'b1fc955d5c-e0e2-45b3-a3cc-a1cf54120f'
4 storage_file_system = myorcdata
5 directories_as_data=yes /*2*/
6 ;
7PROC PRINT DATA=mylib.inventory noobs; /*3*/
8RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.