Guide SAS VIYA

Automatisation SAS Viya : Personnaliser le chargement de données (Data Loading)

Michael 11 Aufrufe
Niveau de difficulté
Confirmé
Veröffentlicht am :
Simon

Expertenrat

Simon

Pour pérenniser vos automatisations dans SAS Viya, appliquez une règle d'or : ne modifiez jamais les Samples natifs, mais dupliquez-les systématiquement pour garantir leur survie lors des mises à jour de la plateforme. Au-delà du routage des Caslibs, soyez intransigeant sur le filtrage des extensions de fichiers. C'est ce paramétrage fin qui immunisera vos traitements contre les fichiers parasites souvent présents dans les répertoires sources et assurera la stabilité de la mise en mémoire.

Dans un environnement SAS© Viya moderne, l'une des tâches les plus courantes pour un administrateur est de s'assurer que les données sont disponibles en mémoire (CAS) pour les utilisateurs dès leur arrivée le matin. Personne ne souhaite charger manuellement ses tables tous les jours.

Pour répondre à ce besoin, SAS© fournit des modèles de jobs prêts à l'emploi ("Samples"). Le plus célèbre d'entre eux est le job "Sample: Import cas-shared-default Public data".

Cependant, ce job est un modèle générique. Pour l'utiliser dans un contexte de production (par exemple pour charger les données du département Finance ou RH), il ne suffit pas de l'activer. Vous devez le copier et, surtout, modifier deux paramètres critiques pour qu'il cible les bonnes données. Voici comment transformer ce modèle générique en un pipeline de chargement sur mesure.

La stratégie de duplication

En tant qu'administrateur, la règle d'or est de ne jamais modifier l'échantillon original (Sample) fourni par SAS©. Si vous le faites, vos modifications risquent d'être écrasées lors d'une mise à jour de la plateforme.

La procédure standard consiste donc à localiser le job dans SAS© Environment Manager (section Jobs and Flows), puis à utiliser la fonction "Copier" pour créer votre propre version (par exemple : "Job de Chargement - Marketing").

Les modifications essentielles

Une fois votre copie créée, vous devez adapter la logique du job à votre besoin spécifique. Ce job fonctionne comme un "aspirateur" : il regarde un dossier, prend les fichiers, et les monte en mémoire.

Pour que cela fonctionne correctement, vous devez impérativement ajuster deux éléments de configuration :

A. Redéfinir la Source et la Destination (Input/Output Caslibs)

Par défaut, le modèle est configuré pour lire et écrire dans la bibliothèque Public. C'est rarement ce que vous souhaitez pour des données métier.

  • Input Caslib (La Source) : Vous devez indiquer au job dans quelle bibliothèque (ou dossier associé) il doit aller chercher les fichiers physiques (.csv, .sas©7bdat, etc.).

    • Exemple : Changer Public vers Finance_Source (un dossier où vos ETL déposent les fichiers plats la nuit).

  • Output Caslib (La Cible) : Vous devez définir où les tables seront chargées en mémoire pour être consommées par les utilisateurs.

    • Exemple : Changer Public vers Finance_Analytics. C'est là que les utilisateurs de SAS© Visual Analytics iront piocher les données.

B. Affiner le Filtre de Fichiers (File Types Filter)

C'est un paramètre souvent oublié qui cause des erreurs d'exécution. Par défaut, le job peut être trop inclusif ou trop restrictif.

Le dossier source sur votre disque peut contenir des fichiers parasites : des fichiers .txt de documentation, des fichiers temporaires, ou des archives .zip que le moteur CAS ne peut pas charger directement en tant que table.

  • L'action à effectuer : Vous devez modifier le filtre pour spécifier exactement quels types de fichiers doivent être traités.

    • Exemple : Si votre dossier source contient un mélange de fichiers, configurez le filtre pour ne prendre que les fichiers *.sas©7bdat ou *.csv. Cela évite que le job n'échoue en essayant de charger un fichier "LisezMoi.txt" comme s'il s'agissait d'une table de données.

Le job d'importation par défaut est une "coquille vide" très puissante. Pour la rendre opérationnelle, souvenez-vous de cette logique simple :

  1. D'où je pars et où j'arrive ? (Modification des Caslibs Input/Output).

  2. Quoi exactement ? (Modification du filtre de types de fichiers).

En maîtrisant ces deux paramètres, vous pouvez créer autant de jobs de chargement automatique qu'il y a de départements dans votre entreprise, garantissant ainsi des données fraîches et sécurisées chaque matin.