textRuleScore applyConcept

Leistungsoptimierung bei der Verarbeitung großer Mengen von Schadensmeldungen

Scénario de test & Cas d'usage

Geschäftskontext

Eine Versicherungsgesellschaft muss täglich Tausende von Schadensmeldungen verarbeiten, um sie schnell an die zuständige Abteilung (z.B. Wasserschaden, Brandschaden) weiterzuleiten. Die Geschwindigkeit der Verarbeitung ist entscheidend, um die Service-Level-Agreements (SLAs) einzuhalten.
Über das Set : textRuleScore

Regelbasiertes Scoring von Textdokumenten.

Entdecken Sie alle Aktionen von textRuleScore
Datenaufbereitung

Erstellt eine große Tabelle mit kurzen Schadensbeschreibungen. Die Verwendung von `parseTableOut` und `parseTableIn` ist besonders bei großen Datenmengen und komplexen Regeln (z.B. mit dem CLAUS_n-Operator) zur Leistungssteigerung gedacht.

Kopiert!
1DATA casuser.schadensberichte;
2 INFILE DATALINES delimiter='|' missover;
3 LENGTH claim_id $20 beschreibung $500;
4 INPUT claim_id $ beschreibung $;
5 DATALINES;
6claim78901|Keller steht nach einem Rohrbruch komplett unter Wasser.
7claim78902|In der Küche brach ein Feuer aus, vermutlich durch ein defektes Gerät.
8claim78903|Sturmschaden am Dach, mehrere Ziegel sind lose.
9claim78904|Wasser drang durch das undichte Fenster im Wohnzimmer ein.
10claim78905|Ein Kurzschluss verursachte einen Brand in der Garage.
11;
12RUN;
13/* Zur Simulation von Volumendaten stellen Sie sich vor, diese Tabelle enthält Millionen von Einträgen. */

Étapes de réalisation

1
Laden der Schadensberichte in CAS.
Kopiert!
1 
2PROC CASUTIL;
3load
4DATA=casuser.schadensberichte outcaslib='casuser' casout='schadensberichte' replace;
5RUN;
6 
2
Erster Durchlauf: Ausführen von applyConcept und Speichern der vorverarbeiteten Dokumente mit dem Parameter `parseTableOut`.
Kopiert!
1PROC CAS;
2 textRuleScore.applyConcept /
3 TABLE={caslib='casuser', name='schadensberichte'},
4 docId='claim_id',
5 text='beschreibung',
6 parseTableOut={caslib='casuser', name='vorverarbeitete_berichte', replace=true},
7 casOut={caslib='casuser', name='schaden_kategorien_lauf1', replace=true};
8RUN;
3
Zweiter Durchlauf: Erneutes Ausführen der Aktion unter Verwendung der vorverarbeiteten Tabelle mit dem Parameter `parseTableIn`, um die erneute Analyse der Dokumente zu vermeiden.
Kopiert!
1PROC CAS;
2 textRuleScore.applyConcept /
3 parseTableIn={caslib='casuser', name='vorverarbeitete_berichte'},
4 casOut={caslib='casuser', name='schaden_kategorien_lauf2', replace=true};
5RUN;

Erwartetes Ergebnis


Die Aktion wird zweimal erfolgreich ausgeführt. Der zweite Durchlauf, der die zwischengespeicherte Tabelle 'vorverarbeitete_berichte' verwendet, validiert die Funktionalität der Leistungsoptimierung. Die endgültige Ausgabetabelle 'schaden_kategorien_lauf2' klassifiziert die Ansprüche korrekt nach Konzepten wie 'WASSERSCHADEN' oder 'FEUERSCHADEN', identisch zu 'schaden_kategorien_lauf1'.