Scénario de test & Cas d'usage
Extracción de reglas booleanas para clasificación.
Descubrir todas las acciones de boolRuleDatos con muy pocos documentos y términos que apenas se repiten (baja cardinalidad y soporte).
| 1 | |
| 2 | DATA mycas.fraud_docs; |
| 3 | INPUT id $ STATUS $; |
| 4 | DATALINES; |
| 5 | A Clean B Fraud C Clean ; |
| 6 | |
| 7 | RUN; |
| 8 | |
| 9 | DATA mycas.fraud_terms; |
| 10 | INPUT tid $ tname $; |
| 11 | DATALINES; |
| 12 | 10 IP_Russia 20 Proxy 30 Local ; |
| 13 | |
| 14 | RUN; |
| 15 | |
| 16 | DATA mycas.fraud_links; |
| 17 | INPUT id $ tid $; |
| 18 | DATALINES; |
| 19 | A 30 B 10 C 30 ; |
| 20 | |
| 21 | RUN; |
| 22 |
| 1 | |
| 2 | PROC CAS; |
| 3 | boolRule.brTrain / TABLE={name='fraud_links'} docId='id' termId='tid' docInfo={TABLE={name='fraud_docs'}, id='id', targets={'status'}, events={'Fraud'}} termInfo={TABLE={name='fraud_terms'}, id='tid', label='tname'} gPositive=50 minSupports=5 casOut={rules={name='reglas_vacias', replace=true}}; |
| 4 | |
| 5 | RUN; |
| 6 |
La acción debe ejecutarse sin fallar (crash), pero debe generar una advertencia en el log indicando que no se encontraron reglas o candidatos que cumplan los criterios. La tabla de salida 'reglas_vacias' debe crearse pero tener 0 filas.