boolRule brTrain

Betrugserkennung mit strengen Filterkriterien (Edge Case)

Scénario de test & Cas d'usage

Geschäftskontext

Eine Bank möchte extrem seltene, aber eindeutige Betrugsmuster in Transaktionsbeschreibungen identifizieren. Da Fehlalarme (False Positives) sehr kostspielig sind, werden sehr strenge Schwellenwerte für die Regelgenauigkeit (g-Score) festgelegt. Dieser Test prüft, wie sich die Aktion verhält, wenn kaum Regeln gefunden werden, die den strengen Kriterien entsprechen.
Über das Set : boolRule

Extraktion boolescher Regeln zur Klassifikation.

Entdecken Sie alle Aktionen von boolRule
Datenaufbereitung

Erstellung eines Datensatzes mit spärlichen Signalen, wo nur wenige Begriffe stark mit der Zielvariable korrelieren.

Kopiert!
1DATA mycas.fraud_terms; INPUT docid termid; DATALINES;
21 999
32 10
43 999
54 20
65 30
76 999
8; RUN;
9 
10DATA mycas.fraud_info; INPUT docid is_fraud $; DATALINES;
111 YES
122 NO
133 YES
144 NO
155 NO
166 YES
17; RUN;

Étapes de réalisation

1
Ausführung mit extrem hohem gPositive-Wert, um nur die stärksten Indikatoren zu erzwingen.
Kopiert!
1PROC CAS;
2 boolRule.brTrain /
3 TABLE={name='fraud_terms'}
4 docId='docid'
5 termId='termid'
6 docInfo={
7 TABLE={name='fraud_info'}
8 id='docid'
9 targets={'is_fraud'}
10 }
11 gPositive=10.0
12 gNegative=10.0
13 minSupports=2
14 casOuts={rules={name='strict_fraud_rules', replace=true}};
15RUN;

Erwartetes Ergebnis


Es wird erwartet, dass nur sehr wenige oder gar keine Regeln generiert werden, da der Schwellenwert (gPositive=10) sehr hoch angesetzt ist. Das System darf nicht abstürzen, sondern sollte eine leere oder sehr kleine Ergebnistabelle zurückgeben und eine entsprechende Meldung im Log ausgeben, dass die Kriterien restriktiv waren.