calculateErrorRate

Q: Quelle est la fonction principale de l'action calculateErrorRate ?

Elle calcule les taux d'erreur des caractères, des mots et des phrases en comparant les transcriptions d'hypothèse et de référence.

Q: Quelles sont les tables d'entrée obligatoires pour cette action ?

Les deux tables d'entrée obligatoires sont la table `reference`, qui contient les transcriptions de référence, et la table `table` (alias `hypothesis`), qui contient les transcriptions d'hypothèse.

Q: Comment spécifier la colonne contenant le texte de référence ?

Utilisez le paramètre `referenceText` pour indiquer le nom de la colonne dans la table de référence qui contient les séquences de mots réelles.

Q: Comment spécifier la colonne contenant le texte d'hypothèse ?

Utilisez le paramètre `tableText` (ou son alias `hypothesisText`) pour indiquer le nom de la colonne dans la table d'hypothèse qui contient les séquences de mots à évaluer.

Q: Est-il possible de faire correspondre les transcriptions si les identifiants ne sont pas dans la première colonne de chaque table ?

Oui, vous pouvez utiliser les paramètres `referenceId` et `tableId` (alias `hypothesisId`) pour spécifier les noms des colonnes contenant les identifiants dans les tables de référence et d'hypothèse, respectivement.

Q: Peut-on filtrer les données d'entrée utilisées par l'action ?

Oui, le paramètre `where` peut être utilisé dans la définition des tables `reference` et `table` pour spécifier une expression de filtrage et ne traiter qu'un sous-ensemble des données.

Q: Quel est l'objectif de l'action `calculateErrorRate` ?

L'action `calculateErrorRate` calcule les taux d'erreur des caractères, des mots et des phrases en comparant les transcriptions d'hypothèses avec les transcriptions de référence.

Q: À quoi sert le paramètre `reference` dans l'action `calculateErrorRate` ?

Le paramètre `reference` spécifie la table qui contient les transcriptions de référence utilisées pour la comparaison.

Q: Que spécifie le paramètre `table` (ou `hypothesis`) ?

Le paramètre `table`, qui a pour alias `hypothesis`, spécifie la table contenant les transcriptions d'hypothèses à comparer.

Q: Comment sont identifiées les transcriptions dans la table de référence ?

Le paramètre `referenceId` spécifie le nom de la colonne dans la table de référence qui contient les identifiants. Par défaut, la première colonne est utilisée.

Description

L'action `calculateErrorRate` est un outil fondamental dans les projets de reconnaissance vocale (Speech-to-Text). Elle permet de quantifier la performance d'un modèle en comparant ses transcriptions (hypothèses) avec un texte de référence (vérité terrain). Elle calcule des métriques clés comme le Taux d'Erreur par Mot (WER - Word Error Rate) et le Taux d'Erreur par Caractère (CER - Character Error Rate), qui sont des standards pour évaluer la précision de ces systèmes.

proc cas; langModel.calculateErrorRate / reference={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, ...}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1, ...}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, ...}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, ...}, where="where-expression"}}, referenceId="variable-name", referenceText="variable-name", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, ...}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1, ...}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, ...}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, ...}, where="where-expression"}}, tableId="variable-name", tableText="variable-name"; run;

Paramètres

Paramètre	Description
reference	Spécifie la table CAS contenant les transcriptions de référence (la vérité terrain). C'est la table qui contient le texte correct.
referenceId	Nom de la colonne dans la table de référence qui contient l'identifiant unique pour chaque transcription. Permet de joindre avec la table d'hypothèses.
referenceText	Nom de la colonne dans la table de référence qui contient le texte de référence lui-même.
table	Spécifie la table CAS contenant les transcriptions hypothétiques (généralement la sortie d'un modèle de reconnaissance vocale).
tableId	Nom de la colonne dans la table d'hypothèses qui contient l'identifiant unique pour chaque transcription. Doit correspondre aux identifiants de `referenceId`.
tableText	Nom de la colonne dans la table d'hypothèses qui contient le texte à évaluer.

Préparation des Données Voir la fiche de ce code dataprep

Création des transcriptions de référence et d'hypothèse

Nous créons deux tables dans la caslib `casuser`. La première, `ref_transcripts`, contient le texte correct (vérité). La seconde, `hyp_transcripts`, contient le texte généré par un modèle, avec quelques erreurs intentionnelles (substitution, insertion, suppression) pour illustrer le calcul du taux d'erreur.

Copié !

1	DATA casuser.ref_transcripts;
2	INFILE DATALINES dsd;
3	LENGTH id 8 text $100;
4	INPUT id text $;
5	DATALINES;
6	1,le chat est sur le tapis
7	2,il fait beau aujourd'hui
8	3,ceci est un test
9	;
10	run;
11
12	data casuser.hyp_transcripts;
13	infile datalines dsd;
14	length id 8 text $100;
15	input id text $;
16	datalines;
17	1,le chat est sur la tapis
18	2,il fait aujourd'hui
19	3,ceci est un super test
20	;
21	RUN;

Exemples

Cet exemple compare les deux tables (`ref_transcripts` et `hyp_transcripts`) pour calculer le taux d'erreur global (mots et caractères). Les colonnes sont explicitement mappées avec les paramètres `referenceId`, `referenceText`, `tableId` et `tableText`.

Code SAS® / CAS Code en attente de validation par la communauté

Copié !

1	PROC CAS;
2	langModel.calculateErrorRate /
3	reference={name='ref_transcripts'},
4	referenceId='id',
5	referenceText='text',
6	TABLE={name='hyp_transcripts'},
7	tableId='id',
8	tableText='text';
9	RUN;
10	QUIT;

Résultat :
La sortie affichera une table de résultats (`ErrorRate`) résumant les taux d'erreur. Elle montrera le nombre total de mots et de caractères, ainsi que le nombre de substitutions, d'insertions et de suppressions. Les taux d'erreur par mot (WER) et par caractère (CER) seront calculés à partir de ces statistiques. Une seconde table (`Detailed_Result`) détaillera les erreurs pour chaque paire de phrases.

Cet exemple montre comment utiliser la clause `where` à l'intérieur des définitions de table pour ne calculer le taux d'erreur que sur un sous-ensemble des données. Ici, nous ignorons la première phrase (id=1) et ne calculons les erreurs que pour les phrases avec un id supérieur à 1.

Code SAS® / CAS Code en attente de validation par la communauté

Copié !

1	PROC CAS;
2	langModel.calculateErrorRate /
3	reference={name='ref_transcripts', where='id > 1'},
4	referenceId='id',
5	referenceText='text',
6	TABLE={name='hyp_transcripts', where='id > 1'},
7	tableId='id',
8	tableText='text';
9	RUN;
10	QUIT;

Résultat :
Le résultat sera similaire à l'exemple de base, mais les calculs ne porteront que sur les phrases 2 et 3. Le nombre total de mots et de caractères sera plus faible, et les taux d'erreur (WER, CER) refléteront uniquement la performance du modèle sur ce sous-ensemble de données.

Ce scénario simule une situation où les tables source ont des noms de colonnes différents des noms par défaut. Nous créons les tables `ref_alt` et `hyp_alt` avec les colonnes `doc_id` et `transcription`. L'exemple montre comment mapper correctement ces noms de colonnes en utilisant les paramètres `referenceId`, `referenceText`, `tableId` et `tableText` pour que l'action fonctionne correctement.

Code SAS® / CAS Code en attente de validation par la communauté

Copié !

1	DATA casuser.ref_alt;
2	INFILE DATALINES dsd;
3	LENGTH doc_id $10 transcription $100;
4	INPUT doc_id $ transcription $;
5	DATALINES;
6	sentence1,le chat est sur le tapis
7	sentence2,il fait beau aujourd'hui
8	;
9	run;
10
11	data casuser.hyp_alt;
12	infile datalines dsd;
13	length doc_id $10 transcription $100;
14	input doc_id $ transcription $;
15	datalines;
16	sentence1,le chat est sur la tapis
17	sentence2,il fait aujourd'hui
18	;
19	RUN;
20
21	PROC CAS;
22	langModel.calculateErrorRate /
23	reference={name='ref_alt'},
24	referenceId='doc_id',
25	referenceText='transcription',
26	TABLE={name='hyp_alt'},
27	tableId='doc_id',
28	tableText='transcription';
29	RUN;
30	QUIT;

Résultat :
L'action produira les mêmes tables de résultats (`ErrorRate` et `Detailed_Result`) que l'exemple de base pour les deux premières phrases. Cela démontre la flexibilité de l'action pour s'adapter à différents schémas de données, à condition que les colonnes soient correctement mappées via les paramètres dédiés.

FAQ

Quelle est la fonction principale de l'action calculateErrorRate ?

Quelles sont les tables d'entrée obligatoires pour cette action ?

Comment spécifier la colonne contenant le texte de référence ?

Comment spécifier la colonne contenant le texte d'hypothèse ?

Est-il possible de faire correspondre les transcriptions si les identifiants ne sont pas dans la première colonne de chaque table ?

Peut-on filtrer les données d'entrée utilisées par l'action ?

Quel est l'objectif de l'action `calculateErrorRate` ?

À quoi sert le paramètre `reference` dans l'action `calculateErrorRate` ?

Que spécifie le paramètre `table` (ou `hypothesis`) ?

Comment sont identifiées les transcriptions dans la table de référence ?

Quelle colonne de la table de référence contient le texte de référence ?

Comment sont identifiées les transcriptions dans la table d'hypothèses ?

Quelle colonne de la table d'hypothèses contient le texte à évaluer ?

Scénarios associés

Cas d'usage

Évaluation Standard de la Transcription d'un Chatbot Bancaire

Une banque déploie un nouvel assistant virtuel et doit valider la qualité de la transcription (Speech-to-Text) avant la mise en production. Le test compare les transcriptions au...

Voir le scénario

Cas d'usage

Test de Performance sur Flux Massif d'Enregistrements

Un centre d'appels souhaite automatiser le contrôle qualité sur 100 000 appels quotidiens. Ce scénario valide que l'action CAS peut traiter une volumétrie importante dans un tem...

Voir le scénario

Cas d'usage

Robustesse face aux Données Incomplètes et IDs Disjoints

Dans un environnement de production réel, des erreurs d'ingestion peuvent survenir : identifiants présents dans la référence mais manquants dans l'hypothèse (et inversement), ou...

Voir le scénario

Actions associées

langModel

IdentifySpeakers

L'ensemble d'actions du modèle linguistique fournit des actions utilisées pou...

langModel

lmDecode

Décode les scores d'un réseau de neurones récurrent (RNN) en utilisant un mod...

langModel

lmImport

L'action `lmImport` est utilisée pour charger un modèle de langage de type n-...

Sommaire

Description

Création des transcriptions de référence et d'hypothèse

Exemples

Exemple Basique de Calcul de Taux d'Erreur

Exemple Avancé : Utilisation de la clause WHERE

Exemple Expert : Utilisation de noms de colonnes non standards

FAQ

Scénarios associés

Cas d'usage

Évaluation Standard de la Transcription d'un Chatbot Bancaire

Cas d'usage

Test de Performance sur Flux Massif d'Enregistrements

Cas d'usage

Robustesse face aux Données Incomplètes et IDs Disjoints

Actions associées

IdentifySpeakers

lmDecode

lmImport