textRuleScore applyCategory

Clasificación de Tickets de Soporte a Gran Escala

Scénario de test & Cas d'usage

Contexto empresarial

Un centro de soporte técnico necesita clasificar un gran volumen de tickets (más de 100,000 por día) en categorías como 'Hardware', 'Software', 'Facturación' o 'Red' para dirigirlos al equipo correcto. La velocidad y la eficiencia del proceso son críticas.
Sobre el conjunto : textRuleScore

Puntuación de documentos de texto basada en reglas.

Descubrir todas las acciones de textRuleScore
Preparación de datos

Simula la creación de una tabla con 150,000 tickets de soporte y un modelo MCO para clasificarlos.

¡Copiado!
1DATA mycas.support_tickets (promote=yes);
2 LENGTH ticket_id $20 description $250;
3 DO i = 1 to 150000;
4 ticket_id = 'TICK-' || put(i, z8.);
5 select (mod(i, 4));
6 when (0) description = 'El servidor no responde, error de conexión de red.';
7 when (1) description = 'No puedo instalar el nuevo software, pide una licencia.';
8 when (2) description = 'Mi monitor no enciende, parece un problema de hardware.';
9 when (3) description = 'Recibí un cargo incorrecto en mi factura de este mes.';
10 otherwise description = 'Otro problema general.';
11 END;
12 OUTPUT;
13 END;
14RUN;
15 
16DATA mycas.ticket_model_mco;
17 LENGTH _term_ $32 _category_ $32;
18 INPUT _term_ $ _category_ $;
19 DATALINES;
20servidor RED
21red RED
22conexión RED
23software SOFTWARE
24licencia SOFTWARE
25instalar SOFTWARE
26hardware HARDWARE
27monitor HARDWARE
28factura FACTURACION
29cargo FACTURACION
30;
31RUN;

Étapes de réalisation

1
Cargar las tablas a la memoria de CAS (ya realizado en data_prep al usar la opción `promote=yes`).
2
Ejecutar la acción `applyCategory` sobre la tabla de gran volumen y medir el tiempo de ejecución. Verificar que el proceso se completa sin errores y que la tabla de salida se genera correctamente.
¡Copiado!
1PROC CAS;
2 textRuleScore.applyCategory /
3 TABLE={caslib='mycas', name='support_tickets'},
4 model={caslib='mycas', name='ticket_model_mco'},
5 docId='ticket_id',
6 text='description',
7 casOut={caslib='mycas', name='ticket_categories', replace=true};
8RUN;

Resultado esperado


La acción debe procesar los 150,000 registros de manera eficiente y sin errores. Se debe crear la tabla `mycas.ticket_categories` con el `ticket_id` y la categoría correspondiente ('RED', 'SOFTWARE', 'HARDWARE', 'FACTURACION') para cada ticket. El escenario valida la escalabilidad y robustez de la acción bajo una carga de datos significativa.