addCaslib - Qu'est-ce qu'une caslib ?

Architecture : Le Pont Hybride (Disque & Mémoire)

Réponse

Une caslib est une bibliothèque qui fournit un moyen d'accéder à des sources de données, telles que des fichiers sur un serveur, des tables dans une base de données, ou des données dans le cloud. Elle agit comme un pointeur vers les données et gère les informations de connexion et les autorisations d'accès.
SAS / CASL
proc cas;
   /* 1. Création du pointeur vers le dossier physique (La Caslib) */
   table.addCaslib /
      name="EspaceProjet",        /* Nom logique de la Caslib */
      dataSource={srcType="PATH"}, /* Type de connexion */
      path="/tmp/mydata",          /* Emplacement physique des données */
      session=true;                /* Portée locale à la session */

   /* 2. Vérification : La Caslib voit le fichier sur le disque... */
   /* (Cela liste les fichiers dans l'espace Source) */
   table.fileInfo / caslib="EspaceProjet";

   /* 3. ...mais l'espace mémoire est encore vide ! */
   /* (Cela liste les tables chargées en RAM) */
   table.tableInfo / caslib="EspaceProjet";
quit;
Cette réponse vous a-t-elle aidé ?
Visualisez la "double vie" de la Caslib. Ne considérez pas une Caslib simplement comme un dossier ou une LIBNAME classique. Une Caslib gère simultanément deux espaces distincts :

L'espace Source (Persistant) : Le lien physique vers le disque ou la base de données (définie par dataSource et path).

L'espace Mémoire (Volatile) : La RAM du serveur CAS où les tables sont chargées pour l'analyse.

Une erreur fréquente est de penser qu'ajouter une Caslib charge automatiquement les données. Ce n'est pas le cas : addCaslib ne fait que "poser les tuyaux". Vous devez ensuite explicitement charger les données de la source vers la mémoire (via loadTable) pour travailler dessus.
addCaslib

table

Doc : addCaslib