textRuleScore applyCategory

Analyse de sentiments dans les retours clients par email

Scénario de test & Cas d'usage

Contexte Métier

Une équipe marketing souhaite classifier automatiquement les emails entrants des clients pour identifier rapidement les retours positifs, les problèmes techniques et les questions sur la tarification. L'objectif est d'accélérer le routage des demandes vers les bons départements.
À propos du Set : textRuleScore

Scoring de documents textuels basé sur des règles.

Découvrir toutes les actions de textRuleScore
Préparation des Données

Création de deux tables CAS : 'emails_clients' contenant les textes à analyser et 'modele_marketing_mco' simulant un modèle de règles pré-compilé. Le modèle est fictif et sa présence est supposée pour le test.

Copié !
1DATA casuser.emails_clients;
2 LENGTH id_email $15. contenu_email $1024.;
3 INFILE DATALINES dsd dlm='|';
4 INPUT id_email$ contenu_email$;
5 DATALINES;
6EMAIL_001|Bonjour, je suis très satisfait de votre service client, rapide et efficace!
7EMAIL_002|Le logiciel plante constamment depuis la dernière mise à jour. C'est inutilisable.
8EMAIL_003|Pourriez-vous m'éclairer sur la différence de prix entre l'offre Pro et l'offre Entreprise ?
9EMAIL_004|Merci à l'équipe pour leur aide précieuse.
10;
11run;
12 
13data casuser.modele_marketing_mco;
14 length _mco_ $ 200;
15 _mco_ = 'simulated compiled model DATA'; OUTPUT;
16RUN;

Étapes de réalisation

1
Exécution de l'action applyCategory avec l'algorithme par défaut (FREQUENCY) pour classifier les emails.
Copié !
1PROC CAS;
2 textRuleScore.applyCategory /
3 TABLE={name='emails_clients', caslib='casuser'},
4 model={name='modele_marketing_mco', caslib='casuser'},
5 docId='id_email',
6 text='contenu_email',
7 casOut={name='emails_categorises', caslib='casuser', replace=true};
8RUN;
9QUIT;
2
Vérification des résultats en affichant la table de sortie. On s'attend à voir les catégories assignées à chaque email.
Copié !
1PROC PRINT DATA=casuser.emails_categorises;
2RUN;

Résultat Attendu


La table 'emails_categorises' est créée dans la caslib 'casuser'. Elle contient les colonnes originales de 'emails_clients' ainsi que des colonnes supplémentaires (ex: _Category_, _Score_) indiquant la catégorie la plus probable pour chaque email (ex: 'Positif', 'Technique', 'Tarification').