langModel calculateErrorRate

Analyse der Case-Sensitivity bei juristischen Texten

Scénario de test & Cas d'usage

Geschäftskontext

Ein juristischer Verlag prüft die Digitalisierung alter Gesetze. Groß- und Kleinschreibung kann bedeutungsunterscheidend sein (z.B. 'sie' vs 'Sie'). Dieser Test forciert Unterschiede in der Schreibung, um die Empfindlichkeit der Metriken zu prüfen.
Über das Set : langModel

Verwaltung großer Sprachmodelle (LLM) und NLP.

Entdecken Sie alle Aktionen von langModel
Datenaufbereitung

Daten mit identischem Wortlaut aber unterschiedlicher Groß-/Kleinschreibung.

Kopiert!
1DATA mycas.legal_ref; INPUT doc_id $ content $char60.; DATALINES;
2LAW_01 Das GESETZ gilt ab sofort
3; RUN;
4 
5DATA mycas.legal_hyp; INPUT doc_id $ content $char60.; DATALINES;
6LAW_01 das Gesetz gilt ab sofort
7; RUN;

Étapes de réalisation

1
Vergleich der Texte ohne vorherige Normalisierung.
Kopiert!
1PROC CAS;
2 langModel.calculateErrorRate /
3 reference='legal_ref'
4 TABLE='legal_hyp';
5RUN;

Erwartetes Ergebnis


Die Aktion sollte Substitutionen für 'Das' vs 'das' und 'GESETZ' vs 'Gesetz' identifizieren, was zu einer hohen WER führt. Dies bestätigt, dass die Metriken (WER/CER) strikt auf Zeichenebene vergleichen.