Scénario de test & Cas d'usage
Regelbasiertes Scoring von Textdokumenten.
Entdecken Sie alle Aktionen von textRuleScoreErstellt eine große Tabelle mit kurzen Schadensbeschreibungen. Die Verwendung von `parseTableOut` und `parseTableIn` ist besonders bei großen Datenmengen und komplexen Regeln (z.B. mit dem CLAUS_n-Operator) zur Leistungssteigerung gedacht.
| 1 | DATA casuser.schadensberichte; |
| 2 | INFILE DATALINES delimiter='|' missover; |
| 3 | LENGTH claim_id $20 beschreibung $500; |
| 4 | INPUT claim_id $ beschreibung $; |
| 5 | DATALINES; |
| 6 | claim78901|Keller steht nach einem Rohrbruch komplett unter Wasser. |
| 7 | claim78902|In der Küche brach ein Feuer aus, vermutlich durch ein defektes Gerät. |
| 8 | claim78903|Sturmschaden am Dach, mehrere Ziegel sind lose. |
| 9 | claim78904|Wasser drang durch das undichte Fenster im Wohnzimmer ein. |
| 10 | claim78905|Ein Kurzschluss verursachte einen Brand in der Garage. |
| 11 | ; |
| 12 | RUN; |
| 13 | /* Zur Simulation von Volumendaten stellen Sie sich vor, diese Tabelle enthält Millionen von Einträgen. */ |
| 1 | |
| 2 | PROC CASUTIL; |
| 3 | load |
| 4 | DATA=casuser.schadensberichte outcaslib='casuser' casout='schadensberichte' replace; |
| 5 | RUN; |
| 6 |
| 1 | PROC CAS; |
| 2 | textRuleScore.applyConcept / |
| 3 | TABLE={caslib='casuser', name='schadensberichte'}, |
| 4 | docId='claim_id', |
| 5 | text='beschreibung', |
| 6 | parseTableOut={caslib='casuser', name='vorverarbeitete_berichte', replace=true}, |
| 7 | casOut={caslib='casuser', name='schaden_kategorien_lauf1', replace=true}; |
| 8 | RUN; |
| 1 | PROC CAS; |
| 2 | textRuleScore.applyConcept / |
| 3 | parseTableIn={caslib='casuser', name='vorverarbeitete_berichte'}, |
| 4 | casOut={caslib='casuser', name='schaden_kategorien_lauf2', replace=true}; |
| 5 | RUN; |
Die Aktion wird zweimal erfolgreich ausgeführt. Der zweite Durchlauf, der die zwischengespeicherte Tabelle 'vorverarbeitete_berichte' verwendet, validiert die Funktionalität der Leistungsoptimierung. Die endgültige Ausgabetabelle 'schaden_kategorien_lauf2' klassifiziert die Ansprüche korrekt nach Konzepten wie 'WASSERSCHADEN' oder 'FEUERSCHADEN', identisch zu 'schaden_kategorien_lauf1'.