boolRule brTrain

Clasificación Automatizada de Correos de Soporte (Estándar)

Scénario de test & Cas d'usage

Contexto empresarial

Un banco desea automatizar el triaje de correos electrónicos entrantes. El objetivo es identificar mensajes urgentes clasificados como 'Queja' basándose en palabras clave negativas (ej. 'error', 'cargo', 'lento') frente a consultas generales, para priorizar su atención en el centro de contacto.
Sobre el conjunto : boolRule

Extracción de reglas booleanas para clasificación.

Descubrir todas las acciones de boolRule
Preparación de datos

Creación de tablas de documentos (correos), diccionario de términos y matriz término-documento.

¡Copiado!
1 
2DATA mycas.bank_docs;
3INFILE DATALINES dlm=',';
4LENGTH tipo $10;
5INPUT id_doc tipo $;
6DATALINES;
71,Queja 2,Consulta 3,Queja 4,Consulta 5,Queja ;
8 
9RUN;
10 
11DATA mycas.bank_terms;
12INFILE DATALINES dlm=',';
13LENGTH term $10;
14INPUT id_term term $;
15DATALINES;
161,error 2,cuenta 3,lento 4,info 5,robo ;
17 
18RUN;
19 
20DATA mycas.bank_links;
21INFILE DATALINES dlm=',';
22INPUT id_doc id_term;
23DATALINES;
241,1 1,3 2,2 2,4 3,1 3,5 4,2 5,5 5,1 ;
25 
26RUN;
27 

Étapes de réalisation

1
Carga de datos y verificación de integridad.
¡Copiado!
1 
2PROC CAS;
3TABLE.tableInfo / TABLE='bank_docs';
4 
5RUN;
6 
2
Entrenamiento del modelo para detectar la categoría 'Queja' (evento positivo).
¡Copiado!
1 
2PROC CAS;
3boolRule.brTrain / TABLE={name='bank_links'} docId='id_doc' termId='id_term' docInfo={TABLE={name='bank_docs'}, id='id_doc', targets={'tipo'}, targetType='BINARY', events={'Queja'}} termInfo={TABLE={name='bank_terms'}, id='id_term', label='term'} casOut={rules={name='reglas_quejas', replace=true}};
4 
5RUN;
6 

Resultado esperado


La acción debe ejecutarse correctamente e identificar reglas booleanas (ej. presencia de 'error' o 'robo') que predicen la categoría 'Queja'. La tabla de salida 'reglas_quejas' debe contener al menos una regla con alta confianza.