Publié le :
Data Access CREATION_INTERNE

Création d'une table Parquet dans Google Cloud Storage

Ce code est également disponible en : Deutsch English Español
Le fichier de clé Google Cloud Storage est généralement spécifié comme un chemin d'accès, mais il est possible de spécifier la clé entière sous forme de chaîne. Pour le moteur Parquet sur Amazon S3 ou Google Cloud Storage, le nom physique peut être vide. S'il n'est pas vide, il spécifie un chemin de dossier dans le bucket, sans inclure le nom de la table. Il est important de noter que dans Google Cloud Storage, les dossiers sont un concept organisationnel et une aide visuelle, mais ils ne représentent pas une hiérarchie de répertoires.
Analyse des données

Type : CREATION_INTERNE


Les exemples utilisent des données SASHELP.

1 Bloc de code
LIBNAME Statement / PROC COPY / PROC PRINT
Explication :
Ce code SAS utilise une déclaration LIBNAME pour se connecter à un bucket Google Cloud Storage avec le moteur Parquet, en spécifiant la plateforme de stockage, le nom du bucket et le chemin du fichier de clé GCS. Ensuite, PROC COPY est utilisée pour créer une table Parquet nommée 'baseball' dans la bibliothèque 'mylib' à partir du jeu de données SASHELP.BASEBALL. Enfin, PROC PRINT affiche les trois premières observations de la table Parquet nouvellement créée.
Copié !
1LIBNAME mylib parquet ""
2 storage_platform = "GCS"
3 storage_bucket_name = "my-bucket"
4 storage_gcs_key_file = "/user/myfiles/my-project-5123b3a258a1.json"
5 ;
6PROC COPY in=sashelp out=mylib;
7 select baseball;
8RUN;
9PROC PRINT DATA=mylib.baseball (obs=3);
10 var name team;
11RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Copyright © SAS Institute Inc. All Rights Reserved


Banner
Le Conseil de l'Expert
Expert
Michael
Responsable de l'infrastructure Viya.
« Si vous travaillez sur des projets multi-cloud, sachez que la syntaxe reste quasi identique pour Amazon S3 (en changeant storage_platform). Pour optimiser vos coûts de stockage et de transfert, privilégiez toujours l'export en Parquet pour vos données froides ou vos archives destinées à être partagées avec d'autres plateformes analytiques »