Si vous commencez votre voyage avec SAS Viya, vous avez probablement entendu parler du serveur CAS. Mais avant de plonger tête baissée dans le code et les scripts complexes, il est crucial de poser les fondations.
Dans cet article, nous allons explorer le concept des CAS Actions (Actions CAS) et des Action Sets (Jeux d'actions), qui constituent le cœur du moteur de calcul de SAS Viya.
Le Serveur CAS : Le Moteur de SAS Viya
Pour comprendre les actions, il faut d'abord comprendre où elles s'exécutent. Le CAS Server (Cloud Analytics Services) est l'environnement d'exécution basé sur le cloud pour la gestion des données et l'analyse dans SAS Viya.
Il utilise la puissance du calcul distribué (distributed computing) pour traiter les données à toutes les étapes du cycle de vie analytique. La règle d'or est simple : pour traiter des données dans le serveur CAS, vous devez d'abord les charger en mémoire.
Les Sources de Données
Les données se connectent au serveur CAS via des Caslibs. Pensez aux Caslibs comme à des points d'accès capables de lire une grande variété de sources :
Bases de données relationnelles.
Flux de données (Streaming).
Jeux de données SAS (.sas7bdat).
Fichiers non structurés et formats courants (XML, JSON, CSV, XLSX).
Les CAS Actions et Action Sets
Une fois vos données chargées en mémoire, c'est là que la magie opère grâce aux CAS Actions.
Qu'est-ce qu'une Action CAS ? Ce sont des unités de travail hautement optimisées. Considérez-les comme des fonctions ou des méthodes puissantes créées spécifiquement pour traiter les données au sein du serveur. Elles peuvent tout faire : charger des données, gérer des tables, effectuer des analyses statistiques, lancer des algorithmes de Machine Learning, ou même exécuter du code DATA step et FedSQL.
Qu'est-ce qu'un Action Set ? Les actions sont regroupées logiquement dans des Action Sets.
Imaginez l'Action Set comme un package ou une bibliothèque.
Imaginez les Actions à l'intérieur comme les méthodes de ce package.
Il existe des douzaines de jeux d'actions et des centaines d'actions disponibles pour couvrir tous vos besoins analytiques.
Comment exécuter ces actions ?
La beauté de SAS Viya réside dans sa flexibilité. Il existe plusieurs façons d'appeler ces actions.
1. Le langage natif : CASL
Le CASL (CAS Language) est un langage de script orienté instructions. Il vous permet d'utiliser une logique de programmation générale pour exécuter des actions, manipuler les résultats et créer des pipelines analytiques complets.
2. Vos langages préférés (SAS, Python, R, etc.)
Vous n'êtes pas obligé d'apprendre le CASL pour utiliser CAS. Vous pouvez exécuter des actions via l'API CAS en utilisant des langages comme SAS, FedSQL, Python, R, Java, Lua ou via des requêtes REST.
Note importante : Pour utiliser Python et R avec le serveur CAS, le package SWAT (Scripting Wrapper for Analytics Transfer) est requis.
Le Pont : Utiliser une syntaxe familière
L'un des avantages majeurs de l'API CAS est qu'elle traduit automatiquement votre syntaxe habituelle en actions CAS optimisées. Vous n'avez souvent même pas besoin de savoir quelle action est exécutée en arrière-plan.
Exemple : Supposons que vous vouliez voir les 10 premières lignes d'une table CAS.
En SAS, vous utiliseriez
PROC PRINT.En Python, vous utiliseriez la méthode
.head().En R, vous utiliseriez la fonction
head().
Dans les trois cas, l'API convertit votre code en l'action CAS fetch. Cela permet aux développeurs de travailler avec des outils qu'ils maîtrisent déjà, tout en bénéficiant de la puissance du serveur CAS.
Une approche polyglotte et collaborative
Cette architecture permet à des équipes aux compétences variées de collaborer. Un Data Scientist utilisant Python, un Statisticien utilisant R et un Analyste utilisant SAS peuvent tous travailler sur les mêmes données et exécuter la même action fetch (ou toute autre action complexe), chacun avec son propre langage.
De plus, SAS Viya propose de nombreuses applications visuelles (point-and-click) qui, en coulisses, exécutent elles aussi ces mêmes actions CAS.
En Résumé
Voici ce qu'il faut retenir pour bien démarrer :
Le Serveur CAS est un moteur de calcul distribué puissant pour le Big Data.
Les CAS Actions sont le "langage natif" et les unités de travail du serveur.
Vous pouvez exécuter ces actions via CASL, mais aussi via SAS, Python, R, Java, etc.
L'API CAS traduit souvent vos fonctions standard (comme
headouPROC PRINT) en actions CAS sans effort de votre part.