Veröffentlicht am :
Datenzugriff CREATION_INTERNE

Sans titre

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Der Zugriff auf ORC-Tabellen, die in Azure Data Lake Storage Gen2 (ADLS) gespeichert sind, erfolgt über die LIBNAME-Anweisung. Die Option 'DIRECTORIES_AS_DATA=YES' ist entscheidend, um Hive-Tabellen zu lesen, die als Verzeichnisse gespeichert sind. Azure-Speicherkonto- und Anwendungs-IDs sind für die Authentifizierung erforderlich. Das Beispiel ist so konzipiert, dass es in einer SAS© Viya 4-Umgebung ausführbar ist, wobei das vorherige Vorhandensein einer ORC-Tabelle in ADLS, hier eine 'inventory'-Tabelle, vorausgesetzt wird. Ein SAS©-Datenerstellungsschritt wird hinzugefügt, um das Beispiel gemäß den Anforderungen eigenständig zu machen, auch wenn in dem ursprünglichen Szenario diese Tabelle über Hive erstellt wird.
Datenanalyse

Type : CREATION_INTERNE


Das Beispiel erstellt eine temporäre SAS-Tabelle 'inventory' mithilfe eines DATA-Schritts mit 'datalines'. Diese Tabelle simuliert die Struktur und Daten einer Hive-ORC-Tabelle, um das Beispiel eigenständig zu machen.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA-Schritt erstellt einen temporären SAS-Datensatz namens 'inventory' mit denselben Spalten und Daten wie die ursprüngliche Hive-Tabelle. In einem realen Szenario zum Lesen aus ADLS müsste diese 'inventory'-Tabelle in das ORC-Format konvertiert und in Ihr Azure Data Lake Storage Gen2-Konto hochgeladen werden.
Kopiert!
1DATA work.inventory;
2 LENGTH descr $32;
3 FORMAT day YYYYMMDD10.;
4 INPUT item descr $ price day:YYMMDD10.;
5 DATALINES;
64600 incandescent A19 15.54 2019-10-17
71023 led A19 14.97 2019-10-17
81023 incandescent B10 5.49 2019-10-16
94219 incandescent E12 3.97 2019-10-15
10;
11RUN;
2 Codeblock
LIBNAME / PROC PRINT
Erklärung :
Die LIBNAME-Anweisung weist den Libref 'mylib' der ORC-Engine zu, die auf einen Speicherort in Azure verweist. Die Optionen 'storage_account_name', 'storage_application_id' und 'storage_file_system' werden verwendet, um die Verbindung zum ADLS-Konto zu konfigurieren. Die Option 'directories_as_data=yes' ist entscheidend, um den Zugriff auf Hive-Tabellen zu ermöglichen, die als Verzeichnisse gespeichert sind. Die PRINT-Prozedur zeigt dann den Inhalt der ORC-Tabelle 'mylib.inventory' an, die aus ADLS gelesen wurde. Ersetzen Sie 'myacct', 'b1fc955d5c-e0e2-45b3-a3cc-a1cf54120f' und 'myorcdata' durch Ihre eigenen Azure-Speicherkontoinformationen. 'data/user' stellt den Pfad zur ORC-Datei in ADLS dar.
Kopiert!
1LIBNAME mylib orc '/data/user'
2 storage_account_name = myacct
3 storage_application_id = 'b1fc955d5c-e0e2-45b3-a3cc-a1cf54120f'
4 storage_file_system = myorcdata
5 directories_as_data=yes
6 ;
7PROC PRINT DATA=mylib.inventory noobs;
8RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Copyright © SAS Institute Inc. All Rights Reserved