searchAnalytics buildAutoComplete

Manejo de Caracteres Especiales y Datos Sucios en Logs de IT

Scénario de test & Cas d'usage

Contexto empresarial

El departamento de IT quiere un buscador para sus logs de errores. Los logs contienen caracteres especiales (#, @, !), códigos numéricos y entradas vacías. Se debe validar que la acción no falle ante datos 'sucios' y genere términos útiles para buscar códigos de error específicos.
Sobre el conjunto : searchAnalytics

Indexación de datos y funcionalidades de búsqueda.

Descubrir todas las acciones de searchAnalytics
Preparación de datos

Creación de datos de logs con caracteres especiales, nulos y códigos mixtos.

¡Copiado!
1DATA casuser.logs_sistema; LENGTH mensaje $100; INPUT mensaje $ &; DATALINES;
2Error_505: Connection Timeout
3Warning #404 @Server1
4CRITICAL_FAILURE!!!
5 
6[INFO] Update Complete
7null_pointer_exception
8; RUN;

Étapes de réalisation

1
Indexación de los logs, asegurando que se manejen entradas vacías.
¡Copiado!
1PROC CAS;
2search.buildIndex /
3 TABLE={caslib='casuser', name='logs_sistema'}
4 casout={caslib='casuser', name='indice_logs', replace=true}
5 indexEmpty=true;
6RUN;
2
Generación de autocompletado para términos técnicos complejos.
¡Copiado!
1PROC CAS;
2searchAnalytics.buildAutoComplete /
3 index={caslib='casuser', name='indice_logs'}
4 casOut={caslib='casuser', name='auto_logs_out', replace=true};
5RUN;

Resultado esperado


La acción debe procesar exitosamente los caracteres especiales. Se espera que términos como 'error_505', 'warning', 'critical_failure' aparezcan en la tabla de salida, ignorando o manejando adecuadamente las líneas vacías y símbolos de puntuación según la configuración predeterminada del índice.