audio computeFeatures

Cas Limites : Fichiers Tronqués et Filtrage Avancé

Scénario de test & Cas d'usage

Contexte Métier

Un projet de numérisation d'archives audio historiques rencontre des fichiers de qualité variable (très courts, bruités). Le but est d'extraire des features 'Filter Bank' (FBANK) pour la classification, mais en imposant un format de sortie fixe (padding) et en gérant des fichiers potentiellement problématiques.
Préparation des Données

Création d'un jeu de données hétérogène incluant des fichiers très courts nécessitant du padding.

Copié !
1 
2DATA casuser.archives_audio;
3LENGTH file_name $50 _audio_data_ $100;
4file_name='short_clip.wav';
5_audio_data_='000102'x;
6OUTPUT;
7file_name='empty_clip.wav';
8_audio_data_=''x;
9OUTPUT;
10 
11RUN;
12 

Étapes de réalisation

1
Tentative d'extraction FBANK sur colonne audio non-standard avec demande de padding (nOutputFrames fixe).
Copié !
1 
2PROC CAS;
3audio.computeFeatures / TABLE={name='archives_audio'} audioColumn='_audio_data_' fbankOptions={nBins=24, lowFreq=100, highFreq=4000} nOutputFrames=500 nContextFrames=2 casOut={name='archive_features', replace=true};
4 
5RUN;
6 

Résultat Attendu


L'action doit gérer la colonne '_audio_data_' (nom non standard). Pour le clip court, elle doit générer 500 frames (avec padding de zéros). Pour le clip vide, elle doit idéalement produire un avertissement ou une sortie vide sans faire planter le serveur.