Automatisation SAS Viya : Personnaliser le chargement de données (Data Loading)

Dans un environnement SAS^© Viya^™ moderne, l'une des tâches les plus courantes pour un administrateur est de s'assurer que les données sont disponibles en mémoire (CAS) pour les utilisateurs dès leur arrivée le matin. Personne ne souhaite charger manuellement ses tables tous les jours.

Pour répondre à ce besoin, SAS^© fournit des modèles de jobs prêts à l'emploi ("Samples"). Le plus célèbre d'entre eux est le job "Sample: Import cas-shared-default Public data".

Cependant, ce job est un modèle générique. Pour l'utiliser dans un contexte de production (par exemple pour charger les données du département Finance ou RH), il ne suffit pas de l'activer. Vous devez le copier et, surtout, modifier deux paramètres critiques pour qu'il cible les bonnes données. Voici comment transformer ce modèle générique en un pipeline de chargement sur mesure.

La stratégie de duplication

Inhaltsverzeichnis

En tant qu'administrateur, la règle d'or est de ne jamais modifier l'échantillon original (Sample) fourni par SAS^©. Si vous le faites, vos modifications risquent d'être écrasées lors d'une mise à jour de la plateforme.

La procédure standard consiste donc à localiser le job dans SAS^© Environment Manager (section Jobs and Flows), puis à utiliser la fonction "Copier" pour créer votre propre version (par exemple : "Job de Chargement - Marketing").

Les modifications essentielles

Une fois votre copie créée, vous devez adapter la logique du job à votre besoin spécifique. Ce job fonctionne comme un "aspirateur" : il regarde un dossier, prend les fichiers, et les monte en mémoire.

Pour que cela fonctionne correctement, vous devez impérativement ajuster deux éléments de configuration :

A. Redéfinir la Source et la Destination (Input/Output Caslibs)

Par défaut, le modèle est configuré pour lire et écrire dans la bibliothèque Public. C'est rarement ce que vous souhaitez pour des données métier.

Input Caslib (La Source) : Vous devez indiquer au job dans quelle bibliothèque (ou dossier associé) il doit aller chercher les fichiers physiques (.csv, .sas^©7bdat, etc.).
- Exemple : Changer Public vers Finance_Source (un dossier où vos ETL déposent les fichiers plats la nuit).
Output Caslib (La Cible) : Vous devez définir où les tables seront chargées en mémoire pour être consommées par les utilisateurs.
- Exemple : Changer Public vers Finance_Analytics. C'est là que les utilisateurs de SAS^© Visual Analytics iront piocher les données.

B. Affiner le Filtre de Fichiers (File Types Filter)

C'est un paramètre souvent oublié qui cause des erreurs d'exécution. Par défaut, le job peut être trop inclusif ou trop restrictif.

Le dossier source sur votre disque peut contenir des fichiers parasites : des fichiers .txt de documentation, des fichiers temporaires, ou des archives .zip que le moteur CAS ne peut pas charger directement en tant que table.

L'action à effectuer : Vous devez modifier le filtre pour spécifier exactement quels types de fichiers doivent être traités.
- Exemple : Si votre dossier source contient un mélange de fichiers, configurez le filtre pour ne prendre que les fichiers *.sas^©7bdat ou *.csv. Cela évite que le job n'échoue en essayant de charger un fichier "LisezMoi.txt" comme s'il s'agissait d'une table de données.

Le job d'importation par défaut est une "coquille vide" très puissante. Pour la rendre opérationnelle, souvenez-vous de cette logique simple :

D'où je pars et où j'arrive ? (Modification des Caslibs Input/Output).
Quoi exactement ? (Modification du filtre de types de fichiers).

En maîtrisant ces deux paramètres, vous pouvez créer autant de jobs de chargement automatique qu'il y a de départements dans votre entreprise, garantissant ainsi des données fraîches et sécurisées chaque matin.

Wichtiger Haftungsausschluss

Die auf WeAreCAS.eu bereitgestellten Codes und Beispiele dienen Lehrzwecken. Es ist zwingend erforderlich, sie nicht blind in Ihre Produktionsumgebungen zu kopieren. Der beste Ansatz besteht darin, die Logik zu verstehen, bevor sie angewendet wird. Wir empfehlen dringend, diese Skripte in einer Testumgebung (Sandbox/Dev) zu testen. WeAreCAS übernimmt keine Verantwortung für mögliche Auswirkungen oder Datenverluste auf Ihren Systemen.

Zurück zur Artikelliste