table

fileInfo

Description

L'action fileInfo est utilisée pour obtenir des informations détaillées sur les fichiers disponibles dans la source de données d'une caslib. Elle est essentielle pour l'exploration de données avant le chargement. Elle permet de lister les fichiers, les répertoires (si demandé), et fournit des attributs tels que la taille (en octets ou Kilo-octets), les dates de modification, et potentiellement le nombre de lignes pour certains formats. Elle supporte le filtrage par nom avec des caractères génériques (% pour plusieurs caractères, _ pour un seul), avec ou sans sensibilité à la casse.

table.fileInfo <result=results> <status=rc> / allFiles=TRUE | FALSE, caslib="string", dataSourceOptions={adls-parameters | bigquery-parameters | ...}, includeDirectories=TRUE | FALSE, kbytes=TRUE | FALSE, path="string", rowCount=TRUE | FALSE, wildEscape="string", wildignore=TRUE | FALSE, wildsensitive=TRUE | FALSE;
Paramètres
ParamètreDescription
allFilesContrôle le filtrage par extension. Si TRUE, liste tous les fichiers. Si FALSE (défaut), ne liste que les fichiers dont l'extension est supportée par le connecteur de la caslib.
caslibNom de la caslib cible. Si omis, la caslib active est utilisée.
dataSourceOptionsPermet de spécifier des options avancées spécifiques au type de source de données (ex: paramètres ADLS, Hadoop, Oracle, etc.).
includeDirectoriesDétermine si les sous-répertoires doivent apparaître dans la liste des résultats (Défaut: TRUE).
kbytesModifie l'unité d'affichage de la taille des fichiers. Si TRUE, la taille est en kilo-octets. Si FALSE (défaut), en octets.
pathFiltre les résultats selon un chemin, un nom de fichier ou un motif utilisant des jokers (% et _).
rowCountDemande le calcul du nombre de lignes pour chaque fichier listé. Note : Cela peut être coûteux en performance et n'est pas supporté par toutes les sources.
wildEscapeDéfinit le caractère d'échappement pour traiter les jokers (% et _) comme des littéraux (Défaut: '\').
wildignoreSi TRUE, désactive l'interprétation des caractères % et _ comme des jokers, les traitant comme des caractères normaux.
wildsensitiveContrôle la sensibilité à la casse lors de l'utilisation de jokers dans le paramètre 'path'. Si FALSE, la recherche est insensible à la casse (Défaut: TRUE).
Préparation des Données Voir la fiche de ce code dataprep
Configuration de la Caslib

L'action fileInfo inspectant des données existantes, nous nous assurons simplement que la session est connectée aux caslibs par défaut.

Copié !
1PROC CAS; caslib _ALL_ assign; RUN;

Exemples

Liste les fichiers de la caslib active supportés par le connecteur, avec les détails par défaut.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1PROC CAS; TABLE.fileInfo; RUN;
Résultat :
Une table CAS affichant : Permission, Owner, Group, Name, Size, Encryption, Time (modification).

Recherche tous les fichiers (insensible à la casse) se terminant par '.csv', affiche leur taille en Ko et calcule le nombre de lignes.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1 
2PROC CAS;
3TABLE.fileInfo / path="%.csv" wildSensitive=false kbytes=true rowCount=true;
4 
5RUN;
6 
Résultat :
Une table filtrée listant les fichiers CSV, avec une colonne 'Size (KB)' et une colonne 'Rows' indiquant le nombre d'enregistrements.

FAQ

Quelle est la fonction principale de l'action fileInfo ?
Comment faire pour que l'action retourne tous les types de fichiers, et non seulement ceux supportés par le connecteur de données ?
Quel paramètre utiliser pour filtrer les résultats selon un nom de fichier, de répertoire ou de table spécifique ?
Comment obtenir la taille des fichiers en kilooctets (Ko) plutôt qu'en octets ?
Est-il possible d'afficher le nombre de lignes contenues dans les fichiers listés ?
Comment contrôler la sensibilité à la casse lors de l'utilisation de caractères génériques dans le paramètre 'path' ?
Peut-on inclure ou exclure les répertoires dans la liste des résultats ?