Statistique
Feature Engineering : Neutralisez les outliers et la non-linéarité grâce à la discrétisation par Quantiles

Cette documentation décrit et illustre l'utilisation de la procédure BINNING pour effectuer le binning par quantiles ...

Voir le code
Statistique
Causal Inference : Simulez des scénarios d'intervention (What-If) et analysez les effets marginaux avec les modèles Bayésiens

Cette documentation explique comment utiliser la procédure BART (Bayesian Additive Regression Trees) pour stocker un ...

Voir le code
Qualité des Données
Garbage In, Garbage Out ? Automatisez la validation de vos datasets avant modélisation via micro-services

Cet exemple lit un fichier de données dans un service en temps réel spécifié, et la sortie du service apparaît dans l...

Voir le code
Machine Learning
Machine Learning Distribué : Comment la parallélisation des calculs (Gradients & Matrices) accélère drastiquement vos entraînements ?

Ce document décrit le fonctionnement du multithreading au sein des procédures d'exploration de données et d'apprentis...

Voir le code
Statistique
Data Preparation : Injectez vos règles métier (Business Logic) dans le profilage de données sans altérer la source

Cet exemple illustre comment la procédure CARDINALITY de SAS Viya traite les variables avec des formats définis par l...

Voir le code
Qualité des données
Automated Data Profiling : Détectez instantanément les outliers et les types d'entités (PII) avant la modélisation

Ce script illustre l'utilisation avancée de la procédure PROC DATAMETRICS pour générer des métriques de qualité des d...

Voir le code
Qualité de Données
Data Quality : Comment générer un rapport de métriques complet pour vos pipelines d'Analytics et de Machine Learning ?

La procédure DATAMETRICS calcule un ensemble de métriques de qualité de données pour les variables d'une table SAS. C...

Voir le code
Statistique
Feature Engineering : Optimisez vos modèles logistiques avec le binning par quantiles et la Valeur d'Information (IV)

Cette fonctionnalité de la procédure BINNING permet de regrouper des variables continues ou catégorielles en catégori...

Voir le code
Administration
Feature Engineering : Comment la discrétisation par WOE transforme vos variables continues en prédicteurs ultra-stables

Cette fonctionnalité permet de générer un rapport sur les tâches du DataFlux Data Management Server, puis d'utiliser ...

Voir le code
Statistique
Feature Engineering : Comment définir des seuils métier personnalisés pour stabiliser vos modèles prédictifs ?

La procédure BINNING avec la méthode CUTPTS permet de regrouper les valeurs continues d'une ou plusieurs variables en...

Voir le code
Macro
SAS Viya : Maîtrisez la fonction GET pour manipuler vos tableaux dynamiques avec précision

La fonction GET renvoie l'élément situé à un indice spécifié dans un tableau dynamique de l'Expression Engine Languag...

Voir le code
Statistique
Inférence Causale : Comment éliminer les biais de sélection avec le Machine Learning (BART) et l'estimation AIPW

La procédure CAEFFECT permet d'estimer les effets de traitement causaux en utilisant des méthodes doublement robustes...

Voir le code
Statistique
Inférence Causale : Comment estimer les effets contrefactuels avec les modèles de boosting de gradient ?

Démontre l'utilisation de la procédure CAEFFECT pour l'estimation de l'effet causal par ajustement de régression, en ...

Voir le code
Statistique
Analyse de Cardinalité : Domptez les variables à forte dimensionnalité pour des rapports d'exploration précis

Ce script SAS illustre comment utiliser la procédure CARDINALITY dans SAS Viya 4 pour analyser la cardinalité des var...

Voir le code
Qualité de données
Data Engineering : Automatisez vos workflows de Data Quality via l'intégration SAS et DataFlux

La procédure DMSRVPROCESSSVC est utilisée pour exécuter des services de traitement sur un serveur DataFlux Data Manag...

Voir le code
Qualité des données
Data Preprocessing : Industrialisez le nettoyage de vos datasets avant modélisation grâce aux services DataFlux

La procédure DMSRVDATASVC permet d'exécuter un service DataFlux Data Management Studio sur un serveur DataFlux Data M...

Voir le code
Manipulation de données
Data Engineering : Pourquoi (et comment) utiliser le format colonne ORC pour accélérer vos requêtes analytiques ?

Exemple de création de tables ORC partitionnées avec des données en ligne, incluant des étapes de nettoyage et de vér...

Voir le code
ETL
Data Skew & Query Pruning : Maîtrisez le partitionnement pour accélérer vos analyses sur grands volumes

Ce script SAS montre comment créer une table de données partitionnée dans une base de données externe (probablement H...

Voir le code
ETL
Data Engineering : Comment sécuriser l'intégrité de vos flux de données et la gestion des tables temporaires

Ce script SAS illustre la création et la suppression de tables, en particulier la gestion des dépendances lors de la ...

Voir le code
Accès aux données
Exploration de données hybrides : Automatisez l'inspection des schémas SQL via les micro-actions de SAS Viya

Ce script SAS démontre l'utilisation du connecteur de données ODBC dans SAS Viya 4 pour accéder aux métadonnées des c...

Voir le code
ETL
Ingestion de données massive : Comment optimiser vos transferts SQL vers le In-Memory de SAS Viya

Ce script SAS démontre comment utiliser le connecteur de données SAS pour charger des données d'un système de gestion...

Voir le code
ETL
Ingestion de données à grande échelle : Comment optimiser le pipeline SAS vers Teradata pour le Big Data ?

Ce script SAS démontre l'utilisation de l'option Teradata Parallel Transporter (TPT) avec SAS/ACCESS pour charger des...

Voir le code
ETL
Ingestion de données massive : Comment charger des millions de lignes en un temps record vers votre Data Warehouse ?

Ce script SAS illustre le chargement en masse de données vers une base de données externe via SAS/ACCESS, en utilisan...

Voir le code
ETL
Ingestion de données : Optimisez vos pipelines Analytics grâce au chargement en masse (Bulk Loading)

Ce script SAS illustre un exemple de chargement en masse (bulkload) de données vers une table DBMS en utilisant SAS/A...

Voir le code
ETL
Data Engineering : Optimisez vos pipelines Analytics grâce au chargement en masse haute performance

Ce script SAS démontre l'utilisation de l'option BULKLOAD pour charger des données dans une table de base de données ...

Voir le code
Optimisation de la performance
Performance SAS : Accélérez massivement vos exports vers Greenplum grâce au Bulkload

Ce script SAS démontre deux méthodes de chargement en masse (bulkload) de données vers une base de données Greenplum ...

Voir le code
ETL
SAS Expert : Ne codez plus vos connexions en dur ! Automatisez le Bulkload avec des Macros Globales

Ce script SAS démontre deux méthodes de chargement en masse (bulkload) de données vers une base de données externe (p...

Voir le code
Optimisation de la performance
Architecture Big Data : Industrialisez l'alimentation de votre Data Lake sans sacrifier la performance

Ce script SAS démontre deux méthodes de chargement en masse de données (bulkload) vers une base de données relationne...

Voir le code
ETL
Optimisez vos flux SAS : Comment charger massivement vers SQL Server avec BULKLOAD

Exemple de chargement en masse (bulkload) de données vers une base de données SQL Server via ODBC.

Voir le code
Accès aux données
Optimisez vos transferts de données : Le guide complet du Bulk Loading avec SAS et SQL Server

Ce script SAS démontre le chargement en masse (bulkload) de données depuis un dataset SAS créé en interne vers une ta...

Voir le code
Accès aux données
Optimisez vos transferts SAS vers Oracle : Le guide ultime du chargement massif avec BULKLOAD

Ce script SAS illustre l'utilisation de l'option BULKLOAD dans un DATA step pour charger efficacement des données ver...

Voir le code
Accès aux données
Accélérez vos pipelines de données : Le secret pour injecter des Big Data dans Snowflake en un temps record

Ce script SAS illustre l'utilisation de la fonctionnalité de chargement en masse (bulkload) de SAS/ACCESS pour transf...

Voir le code
Administration
Sécurisez vos données CAS : Comment configurer le filtrage au niveau ligne (RLS) dans SAS Viya

Ce document explique comment définir un filtre simple au niveau des lignes pour contrôler l'accès des utilisateurs au...

Voir le code
Macro
Maîtrisez l'instruction SOURCE dans PROC CAS : Le guide du code dynamique sous Viya

La déclaration SOURCE dans PROC CAS permet d'intégrer du texte ou du code SAS/CASL directement dans un programme CASL...

Voir le code
Gestion des données
Formats SAS et Viya : Le secret pour des rapports ultra-lisibles en environnement CAS

Ce document explique que SAS fournit des formats permanents utilisables avec SAS Cloud Analytic Services. Pour une li...

Voir le code
Accès aux données
Intégration SAS Viya & Informix : Guide complet pour booster vos flux ETL et CAS

Ce document décrit le connecteur de données SAS Cloud Analytic Services (CAS) pour Informix, permettant de lire et d'...

Voir le code
Accès aux données
Accélérez vos pipelines Big Data : Comment coupler la puissance de Netezza à l'analyse en mémoire de SAS CAS

Le connecteur de données Netezza permet à SAS Cloud Analytic Services (CAS) de se connecter et d'accéder aux données ...

Voir le code
Manipulation de données
Syntaxe CASL : Comment simplifier vos actions SAS Viya grâce à la coercition de paramètres

Explique le concept de coercition de paramètres dans CASL, une fonctionnalité qui simplifie l'écriture du code en per...

Voir le code
Manipulation de données
SAS Viya : Comment rendre vos formats personnalisés persistants et partageables dans CAS

Explique comment rendre une bibliothèque de formats SAS définie par l'utilisateur disponible pour toutes les sessions...

Voir le code
Administration
Ne laissez plus de failles dans vos données : Maîtrisez la granularité des accès sur vos tables CAS

Cet exemple explique comment supprimer un contrôle d'accès direct sur une table CAS, permettant ainsi à l'accès d'êtr...

Voir le code
Statistique
SAS Viya SVMACHINE : Comment construire des modèles de classification ultra-performants en calcul distribué

La procédure SVMACHINE implémente des machines à vecteurs de support (SVM) pour la classification et la régression. E...

Voir le code
Accès aux données
Débridez vos modèles statistiques : Analysez vos Big Data Redshift sans quitter SAS Viya

Ce connecteur permet de transférer des données entre une base de données Amazon Redshift et SAS Cloud Analytic Servic...

Voir le code
Accès aux données
Data Science Massive : Exploitez la puissance de Greenplum pour vos modèles statistiques sans latence

Permet le transfert de données entre une base de données Greenplum et SAS Cloud Analytic Services (CAS).

Voir le code
Accès aux données
Adieu l'échantillonnage : Analysez 100% de vos Big Data Hive pour des modèles statistiques plus robustes

Permet de transférer des données entre Hive et les services d'analyse Cloud (CAS) de SAS.

Voir le code
Administration
Data Science et RGPD : Comment analyser vos données sans jamais compromettre la confidentialité

Cet exemple illustre comment modifier les contrôles d'accès sur une colonne spécifique d'une table CAS afin de la mas...

Voir le code
Statistique
PROC FOREST sous SAS Viya : Maîtrisez les Forêts Aléatoires pour des prédictions sans surapprentissage

La procédure FOREST dans SAS Viya implémente l'algorithme des forêts aléatoires pour les tâches de classification et ...

Voir le code
Statistique
Machine Learning : Séparez l'Entraînement de l'Inférence pour Industrialiser vos Forêts Aléatoires

Ce script illustre l'utilisation de la procédure FOREST pour entraîner un modèle de forêt aléatoire, le sauvegarder, ...

Voir le code
Analyse Textuelle
Maîtrisez le NLP sous SAS Viya : Le guide complet de PROC TEXTMINE pour structurer vos données textuelles

La procédure TEXTMINE est utilisée pour effectuer des tâches de fouille de texte et de traitement du langage naturel ...

Voir le code
Administration
Devenez le maître du serveur CAS : Guide complet de la gestion des privilèges sous SAS Viya

Ce document décrit les concepts et les méthodes pour désigner ou gérer les privilèges de superutilisateur dans SAS Cl...

Voir le code
Analyse Textuelle
SAS Viya et BOOLRULE : Générez automatiquement des règles métiers "Si... Alors" depuis vos données textuelles

Cet exemple démontre l'utilisation de la procédure BOOLRULE pour extraire des règles d'association à partir de donnée...

Voir le code

Derniers codes ajoutés

Optimisation SAS : Maîtriser FULLSTIMER pour auditer vos performances
Ce document explique comment collecter et interpréter les statistiques de performance dans SAS, en utilisant les options système FULLSTIMER et STIMER pour analyser le temps réel, le temps CPU, l'utilisation de la mémoire et les I/O.
Optimisation de la performance
Guide SAS : Comment gérer et corriger les erreurs de données (Invalid Data)
Ce document explique les erreurs de données qui surviennent lorsque certaines valeurs de données ne sont pas appropriées pour les instructions SAS spécifiées dans le programme. Par exemple, si une variable est définie comme numérique mais que sa valeur est de type caractère, SAS génère une erreur de données.
Débogage
Maîtriser le débogage SAS : Points-virgules, guillemets et option NOAUTOCORRECT
Les erreurs de syntaxe surviennent lorsque les instructions d'un programme ne sont pas conformes aux règles du langage SAS. Cet article fournit des exemples et des explications sur la manière dont SAS gère ces erreurs, y compris les mots-clés mal orthographiés et les points-virgules manquants, ainsi que des conseils pour les résoudre.
Débogage
SAS DATA Step : Maîtriser la variable IORC et SYSRC pour un code robuste
Cette documentation fournit des exemples pratiques pour le débogage d'erreurs en programmation SAS, en se concentrant sur la gestion des conditions inattendues et des erreurs logiques dans les étapes DATA.
Débogage
Log SAS : Pourquoi votre programme tourne mais produit des erreurs (Warning & Notes)
Ce document décrit les erreurs qui surviennent lors de l'exécution d'un programme SAS traitant des valeurs de données. La plupart de ces erreurs produisent des avertissements ou des notes dans le journal SAS.
Débogage
Variables non initialisées : Sécurisez votre code SAS avec l'option VARINITCHK
Les erreurs sémantiques surviennent lorsque la forme des éléments d'une instruction SAS est correcte, mais que les éléments ne sont pas valides pour cette utilisation. Elles sont détectées à la compilation et peuvent activer le mode de vérification de syntaxe.
Débogage
Vitesse vs Mémoire : Comment configurer SAS pour une performance CPU maximale ?
Ce document fournit des techniques pour optimiser les performances du processeur (CPU) dans les programmes SAS, notamment en gérant l'utilisation de la mémoire, en réduisant les opérations d'entrée/sortie (I/O), en stockant les programmes compilés, en optimisant les chemins de recherche des fichiers exécutables SAS, en spécifiant les longueurs de variables et en utilisant le traitement parallèle. Il aborde également l'optimisation de la compilation des programmes SAS.
Optimisation de la performance
Log SAS illisible ? Optimisez vos audits avec MSGLEVEL et les variables IORC
Ce document décrit diverses méthodes et outils pour le débogage des programmes SAS, y compris l'identification et la résolution des erreurs de syntaxe, des erreurs sémantiques et des erreurs d'exécution. Il présente également les modes de point de contrôle et de redémarrage pour les processus par lots, ainsi que le mode de vérification de la syntaxe.
Débogage
SAS : Maîtrisez l'instruction MODIFY pour mettre à jour vos tables sans les dupliquer
Cet exemple illustre comment utiliser l'instruction `MODIFY` dans un DATA Step pour mettre à jour un jeu de données principal (`master`) à partir d'un jeu de données de transaction. Les observations sont appariées sur une variable clé (`partNumber`), permettant la modification d'observations existantes et l'ajout de nouvelles observations.
ETL
SAS Viya : Comment charger et manipuler vos données in-memory avec PROC CASUTIL
Cet exemple utilise trois instructions PROC CASUTIL pour charger, partitionner et modifier une table de données dans l'environnement SAS Cloud Analytic Services (CAS).
Manipulation de données CAS