activeLearn alJoin

Scénario Standard : Enrichissement de données client avec des réponses à un sondage

Scénario de test & Cas d'usage

Contexte Métier

Une équipe marketing souhaite analyser les résultats d'un sondage de satisfaction. L'objectif est de joindre les réponses du sondage à la table client principale pour enrichir les profils. Il est crucial de conserver tous les clients dans l'analyse, même ceux n'ayant pas répondu, pour calculer le taux de réponse.
À propos du Set : activeLearn

Apprentissage actif pour optimiser l'étiquetage des données.

Découvrir toutes les actions de activeLearn
Préparation des Données

Création d'une table de clients et d'une table de réponses au sondage. Certains clients n'ont pas de réponse associée.

Copié !
1DATA mycas.clients_principaux;
2 INPUT id_client $ nom $ age;
3 DATALINES;
4C001 Dupont 45
5C002 Martin 32
6C003 Durand 51
7C004 Petit 28
8C005 Leroy 60
9;
10RUN;
11 
12DATA mycas.reponses_sondage;
13 INPUT id_client $ satisfaction (1-5) date_reponse date9.;
14 FORMAT date_reponse yymmdd10.;
15 DATALINES;
16C001 5 25NOV2025
17C003 2 26NOV2025
18C004 4 25NOV2025
19;
20RUN;

Étapes de réalisation

1
Jointure à gauche (par défaut) pour conserver tous les clients et ajouter les réponses de ceux qui ont participé.
Copié !
1PROC CAS;
2 ACTION activeLearn.alJoin /
3 TABLE={name='clients_principaux'}
4 annotatedTable={name='reponses_sondage'}
5 id='id_client'
6 casOut={name='clients_enrichis_left', replace=true};
7RUN;
8QUIT;
2
Jointure interne pour ne sélectionner que les clients ayant répondu au sondage, afin de créer un segment pour une analyse ciblée.
Copié !
1PROC CAS;
2 ACTION activeLearn.alJoin /
3 TABLE={name='clients_principaux'}
4 annotatedTable={name='reponses_sondage'}
5 id='id_client'
6 joinType='INNER'
7 casOut={name='clients_repondants_inner', replace=true};
8RUN;
9QUIT;

Résultat Attendu


L'étape 1 crée la table `clients_enrichis_left` avec 5 lignes. Les clients C002 et C005 ont des valeurs manquantes pour `satisfaction` et `date_reponse`. L'étape 2 crée la table `clients_repondants_inner` avec 3 lignes (C001, C003, C004), contenant uniquement les données des clients ayant répondu.