L'exemple crée une table SAS temporaire 'inventory' en utilisant une étape DATA avec des 'datalines'. Cette table simule la structure et les données d'une table Hive ORC pour rendre l'exemple autonome.
1 Bloc de code
DATA STEP Data
Explication : Cette étape DATA crée un jeu de données SAS temporaire nommé 'inventory' avec les mêmes colonnes et données que la table Hive originale. Dans un scénario réel pour lire depuis ADLS, cette table 'inventory' devrait être convertie au format ORC et téléversée dans votre compte Azure Data Lake Storage Gen2.
Copié !
DATA work.inventory;
LENGTH descr $32;
FORMAT day YYYYMMDD10.;
INPUT item descr $ price day:YYMMDD10.;
DATALINES;
4600 incandescent A19 15.54 2019-10-17
1023 led A19 14.97 2019-10-17
1023 incandescent B10 5.49 2019-10-16
4219 incandescent E12 3.97 2019-10-15
;
RUN;
1
DATA work.inventory;
2
LENGTH descr $32;
3
FORMAT day YYYYMMDD10.;
4
INPUT item descr $ price day:YYMMDD10.;
5
DATALINES;
6
4600 incandescent A19 15.542019-10-17
7
1023 led A19 14.972019-10-17
8
1023 incandescent B10 5.492019-10-16
9
4219 incandescent E12 3.972019-10-15
10
;
11
RUN;
2 Bloc de code
LIBNAME / PROC PRINT
Explication : L'instruction LIBNAME attribue le libref 'mylib' au moteur ORC, pointant vers un emplacement dans Azure. Les options 'storage_account_name', 'storage_application_id' et 'storage_file_system' sont utilisées pour configurer la connexion au compte ADLS. L'option 'directories_as_data=yes' est cruciale pour permettre l'accès aux tables Hive stockées sous forme de répertoires. La procédure PRINT affiche ensuite le contenu de la table ORC 'mylib.inventory' lue depuis ADLS. Remplacez 'myacct', 'b1fc955d5c-e0e2-45b3-a3cc-a1cf54120f' et 'myorcdata' par vos propres informations de compte de stockage Azure. 'data/user' représente le chemin d'accès au fichier ORC dans ADLS.
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
« Lorsque vous travaillez sur Azure, assurez-vous que votre serveur SAS est situé dans la même région que votre compte de stockage ADLS. Cela réduira drastiquement la latence réseau et éliminera les coûts de transfert de données sortantes (egress fees), rendant vos exécutions PROC PRINT ou vos analyses statistiques beaucoup plus rapides »
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.