Leistungsoptimierung bei der Verarbeitung großer Mengen von Schadensmeldungen

Geschäftskontext

Eine Versicherungsgesellschaft muss täglich Tausende von Schadensmeldungen verarbeiten, um sie schnell an die zuständige Abteilung (z.B. Wasserschaden, Brandschaden) weiterzuleiten. Die Geschwindigkeit der Verarbeitung ist entscheidend, um die Service-Level-Agreements (SLAs) einzuhalten.

Über das Set : textRuleScore

Regelbasiertes Scoring von Textdokumenten.

Entdecken Sie alle Aktionen von textRuleScore

Datenaufbereitung

Erstellt eine große Tabelle mit kurzen Schadensbeschreibungen. Die Verwendung von `parseTableOut` und `parseTableIn` ist besonders bei großen Datenmengen und komplexen Regeln (z.B. mit dem CLAUS_n-Operator) zur Leistungssteigerung gedacht.

Kopiert!

1	DATA casuser.schadensberichte;
2	INFILE DATALINES delimiter='\|' missover;
3	LENGTH claim_id $20 beschreibung $500;
4	INPUT claim_id $ beschreibung $;
5	DATALINES;
6	claim78901\|Keller steht nach einem Rohrbruch komplett unter Wasser.
7	claim78902\|In der Küche brach ein Feuer aus, vermutlich durch ein defektes Gerät.
8	claim78903\|Sturmschaden am Dach, mehrere Ziegel sind lose.
9	claim78904\|Wasser drang durch das undichte Fenster im Wohnzimmer ein.
10	claim78905\|Ein Kurzschluss verursachte einen Brand in der Garage.
11	;
12	RUN;
13	/* Zur Simulation von Volumendaten stellen Sie sich vor, diese Tabelle enthält Millionen von Einträgen. */

Étapes de réalisation

Laden der Schadensberichte in CAS.

Kopiert!

1
2	PROC CASUTIL;
3	load
4	DATA=casuser.schadensberichte outcaslib='casuser' casout='schadensberichte' replace;
5	RUN;
6

Erster Durchlauf: Ausführen von applyConcept und Speichern der vorverarbeiteten Dokumente mit dem Parameter `parseTableOut`.

Kopiert!

1	PROC CAS;
2	textRuleScore.applyConcept /
3	TABLE={caslib='casuser', name='schadensberichte'},
4	docId='claim_id',
5	text='beschreibung',
6	parseTableOut={caslib='casuser', name='vorverarbeitete_berichte', replace=true},
7	casOut={caslib='casuser', name='schaden_kategorien_lauf1', replace=true};
8	RUN;

Zweiter Durchlauf: Erneutes Ausführen der Aktion unter Verwendung der vorverarbeiteten Tabelle mit dem Parameter `parseTableIn`, um die erneute Analyse der Dokumente zu vermeiden.

Kopiert!

1	PROC CAS;
2	textRuleScore.applyConcept /
3	parseTableIn={caslib='casuser', name='vorverarbeitete_berichte'},
4	casOut={caslib='casuser', name='schaden_kategorien_lauf2', replace=true};
5	RUN;

Erwartetes Ergebnis

Die Aktion wird zweimal erfolgreich ausgeführt. Der zweite Durchlauf, der die zwischengespeicherte Tabelle 'vorverarbeitete_berichte' verwendet, validiert die Funktionalität der Leistungsoptimierung. Die endgültige Ausgabetabelle 'schaden_kategorien_lauf2' klassifiziert die Ansprüche korrekt nach Konzepten wie 'WASSERSCHADEN' oder 'FEUERSCHADEN', identisch zu 'schaden_kategorien_lauf1'.

Voir la documentation technique de applyConcept