audio computeFeatures

Extraction Standard MFCC pour Analyse de Sentiments

Scénario de test & Cas d'usage

Contexte Métier

Une banque souhaite analyser les appels de son service client pour détecter l'insatisfaction. Les fichiers audio bruts doivent être transformés en coefficients MFCC pour alimenter un modèle de réseau de neurones (NLP/Audio). On doit conserver les identifiants d'appels pour la jointure ultérieure.
Préparation des Données

Simulation d'une table d'entrée contenant des données audio binaires simulées et des métadonnées d'appel.

Copié !
1 
2DATA casuser.appels_bruts;
3LENGTH call_id $20 client_id $20 _audio_ $2000;
4DO i=1 to 50;
5call_id=cats('CALL_', i);
6client_id=cats('CLI_', i*10);
7_audio_ = '01010101'x;
8/* Simulation binaire dummy */ OUTPUT;
9END;
10 
11RUN;
12 

Étapes de réalisation

1
Exécution de l'action avec extraction MFCC standard et conservation des clés métier (call_id, client_id).
Copié !
1 
2PROC CAS;
3audio.computeFeatures / TABLE={name='appels_bruts'} audioColumn='_audio_' copyVars={'call_id', 'client_id'} mfccOptions={nCeps=13, useEnergy=true} casOut={name='features_sentiments', replace=true};
4 
5RUN;
6 
2
Vérification simple de la structure de sortie (vérification que les colonnes copiées sont présentes).
Copié !
1 
2PROC CAS;
3TABLE.columnInfo / TABLE={name='features_sentiments'};
4 
5RUN;
6 

Résultat Attendu


Une table 'features_sentiments' est générée contenant les vecteurs MFCC pour chaque trame audio, accompagnée des colonnes 'call_id' et 'client_id'. Le calcul utilise l'énergie (useEnergy=true).