Extraction Standard MFCC pour Analyse de Sentiments

Contexte Métier

Une banque souhaite analyser les appels de son service client pour détecter l'insatisfaction. Les fichiers audio bruts doivent être transformés en coefficients MFCC pour alimenter un modèle de réseau de neurones (NLP/Audio). On doit conserver les identifiants d'appels pour la jointure ultérieure.

Préparation des Données

Simulation d'une table d'entrée contenant des données audio binaires simulées et des métadonnées d'appel.

Copié !

1
2	DATA casuser.appels_bruts;
3	LENGTH call_id $20 client_id $20 _audio_ $2000;
4	DO i=1 to 50;
5	call_id=cats('CALL_', i);
6	client_id=cats('CLI_', i*10);
7	_audio_ = '01010101'x;
8	/* Simulation binaire dummy */ OUTPUT;
9	END;
10
11	RUN;
12

Étapes de réalisation

Exécution de l'action avec extraction MFCC standard et conservation des clés métier (call_id, client_id).

Copié !

1
2	PROC CAS;
3	audio.computeFeatures / TABLE={name='appels_bruts'} audioColumn='_audio_' copyVars={'call_id', 'client_id'} mfccOptions={nCeps=13, useEnergy=true} casOut={name='features_sentiments', replace=true};
4
5	RUN;
6

Vérification simple de la structure de sortie (vérification que les colonnes copiées sont présentes).

Copié !

1
2	PROC CAS;
3	TABLE.columnInfo / TABLE={name='features_sentiments'};
4
5	RUN;
6

Résultat Attendu

Une table 'features_sentiments' est générée contenant les vecteurs MFCC pour chaque trame audio, accompagnée des colonnes 'call_id' et 'client_id'. Le calcul utilise l'énergie (useEnergy=true).

Voir la documentation technique de computeFeatures