table

fileInfo

Description

L'action fileInfo est utilisée pour obtenir des informations détaillées sur les fichiers disponibles dans la source de données d'une caslib. Elle est essentielle pour l'exploration de données avant le chargement. Elle permet de lister les fichiers, les répertoires (si demandé), et fournit des attributs tels que la taille (en octets ou Kilo-octets), les dates de modification, et potentiellement le nombre de lignes pour certains formats. Elle supporte le filtrage par nom avec des caractères génériques (% pour plusieurs caractères, _ pour un seul), avec ou sans sensibilité à la casse.

table.fileInfo <result=results> <status=rc> / allFiles=TRUE | FALSE, caslib="string", dataSourceOptions={adls-parameters | bigquery-parameters | ...}, includeDirectories=TRUE | FALSE, kbytes=TRUE | FALSE, path="string", rowCount=TRUE | FALSE, wildEscape="string", wildignore=TRUE | FALSE, wildsensitive=TRUE | FALSE;
Paramètres
ParamètreDescription
allFiles Contrôle le filtrage par extension. Si TRUE, liste tous les fichiers. Si FALSE (défaut), ne liste que les fichiers dont l'extension est supportée par le connecteur de la caslib.
caslib Nom de la caslib cible. Si omis, la caslib active est utilisée.
dataSourceOptions Permet de spécifier des options avancées spécifiques au type de source de données (ex: paramètres ADLS, Hadoop, Oracle, etc.).
includeDirectories Détermine si les sous-répertoires doivent apparaître dans la liste des résultats (Défaut: TRUE).
kbytes Modifie l'unité d'affichage de la taille des fichiers. Si TRUE, la taille est en kilo-octets. Si FALSE (défaut), en octets.
path Filtre les résultats selon un chemin, un nom de fichier ou un motif utilisant des jokers (% et _).
rowCount Demande le calcul du nombre de lignes pour chaque fichier listé. Note : Cela peut être coûteux en performance et n'est pas supporté par toutes les sources.
wildEscape Définit le caractère d'échappement pour traiter les jokers (% et _) comme des littéraux (Défaut: '\').
wildignore Si TRUE, désactive l'interprétation des caractères % et _ comme des jokers, les traitant comme des caractères normaux.
wildsensitive Contrôle la sensibilité à la casse lors de l'utilisation de jokers dans le paramètre 'path'. Si FALSE, la recherche est insensible à la casse (Défaut: TRUE).
Préparation des Données Voir la fiche de ce code dataprep
Configuration de la Caslib

L'action fileInfo inspectant des données existantes, nous nous assurons simplement que la session est connectée aux caslibs par défaut.

Copié !
1PROC CAS; caslib _ALL_ assign; RUN;

Exemples

Liste les fichiers de la caslib active supportés par le connecteur, avec les détails par défaut.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1PROC CAS; TABLE.fileInfo; RUN;
Résultat :
Une table CAS affichant : Permission, Owner, Group, Name, Size, Encryption, Time (modification).

Recherche tous les fichiers (insensible à la casse) se terminant par '.csv', affiche leur taille en Ko et calcule le nombre de lignes.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3TABLE.fileInfo / path="%.csv" wildSensitive=false kbytes=true rowCount=true;
4 
5RUN;
6 
Résultat :
Une table filtrée listant les fichiers CSV, avec une colonne 'Size (KB)' et une colonne 'Rows' indiquant le nombre d'enregistrements.

FAQ

Quelle est la fonction principale de l'action fileInfo ?
Comment faire pour que l'action retourne tous les types de fichiers, et non seulement ceux supportés par le connecteur de données ?
Quel paramètre utiliser pour filtrer les résultats selon un nom de fichier, de répertoire ou de table spécifique ?
Comment obtenir la taille des fichiers en kilooctets (Ko) plutôt qu'en octets ?
Est-il possible d'afficher le nombre de lignes contenues dans les fichiers listés ?
Comment contrôler la sensibilité à la casse lors de l'utilisation de caractères génériques dans le paramètre 'path' ?
Peut-on inclure ou exclure les répertoires dans la liste des résultats ?