ETL CAS

Importer un fichier CSV vers une Caslib avec la PROC CASUTI

Ce code est également disponible en : Deutsch English Español
Niveau de difficulté
Débutant
Publié le :
Stéphanie

Le Conseil de l'Expert

Stéphanie
Spécialiste Machine Learning et IA.

Prenez le réflexe d'utiliser CONTENTS ou LIST au sein de CASUTIL avant chaque opération majeure. Cela vous permet de vérifier si une table est déjà chargée ou promue, vous évitant ainsi des erreurs de collision ou des consommations inutiles de mémoire sur votre environnement Viya

Attention : Ce code nécessite des droits administrateur.
La procédure CASUTIL est un outil essentiel pour la gestion des données dans l'environnement SAS© Cloud Analytic Services (CAS). Elle permet aux utilisateurs d'interagir directement avec les caslibs et les tables CAS pour des opérations telles que l'affichage des détails des tables, la suppression de données d'une source, le déchargement de tables des caslibs, la liste des tables disponibles, le chargement de nouvelles données dans des caslibs, la promotion de tables en portée globale pour les rendre accessibles à d'autres sessions, et la sauvegarde de tables CAS vers des sources de données externes. L'exemple fourni illustre le chargement d'un fichier CSV dans une caslib CAS.
Analyse des données

Type : CREATION_INTERNE


L'exemple montre comment charger un fichier CSV local ('County_Population.csv') dans une caslib CAS, créant ainsi une table CAS à partir de données externes. L'option IMPORTOPTIONS=(filetype="csv" getnames="true") est utilisée pour spécifier le type de fichier et s'assurer que les noms de colonnes sont importés correctement. L'accès à la source de données est géré via une caslib de type DNFS (Distributed Network File System).

1 Bloc de code
PROC CASUTIL Data
Explication :
Ce code SAS illustre le processus de chargement d'un fichier CSV dans SAS Cloud Analytic Services (CAS). La première étape consiste à définir une caslib nommée 'csvfiles' de type DNFS, en spécifiant le chemin d'accès aux fichiers CSV. Cela permet à CAS d'accéder aux données stockées dans ce répertoire. Ensuite, la procédure PROC CASUTIL est utilisée pour lister les fichiers disponibles dans cette caslib (list files). La commande 'load' est ensuite employée pour charger le fichier 'County_Population.csv' dans CAS. L'option 'importoptions=(filetype="csv" getnames="true")' indique que le fichier est au format CSV et que la première ligne contient les noms des variables. La table CAS résultante sera nommée 'county_population'. Enfin, 'list tables' affiche les tables CAS actuellement chargées dans la caslib.
Copié !
1caslib csvfiles task=add type=dnfs
2 path="/data/csv/"
3 desc="Spreadsheets and CSV source data.";
4
5PROC CASUTIL;
6 list files;
7 
8 load casdata="County_Population.csv"
9 importoptions=(filetype="csv" getnames="true")
10 casout="county_population";
11 
12 list tables;
13QUIT;
L'Astuce Pro
Pour optimiser le chargement de fichiers CSV via PROC CASUTIL, utilisez l option importoptions avec l argument guessrows=MAX pour forcer l analyse de l integralite du fichier avant de definir les types et longueurs de colonnes, evitant ainsi la troncature de donnees si les premieres lignes contiennent des chaines de caracteres plus courtes que les suivantes.
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Copyright © SAS Institute Inc. All Rights Reserved.


Documentation liée

Aucune documentation spécifique pour cette catégorie.