Scénario de test & Cas d'usage
Gestión de grandes modelos de lenguaje (LLM) y PNL.
Descubrir todas las acciones de langModelCreación de un conjunto de datos pequeño con casos típicos de errores: sustitución, inserción y eliminación.
| 1 | DATA casuser.llamadas_ref; LENGTH call_id $ 10 transcript $ 200; INFILE DATALINES delimiter='|'; INPUT call_id $ transcript $; DATALINES; |
| 2 | C001|quiero consultar mi saldo actual |
| 3 | C002|tengo un problema con mi tarjeta de credito |
| 4 | C003|gracias por su ayuda buenos dias |
| 5 | ; RUN; |
| 6 | DATA casuser.llamadas_hyp; LENGTH call_id $ 10 transcript $ 200; INFILE DATALINES delimiter='|'; INPUT call_id $ transcript $; DATALINES; |
| 7 | C001|quiero consultar saldo actual |
| 8 | C002|tengo un problema con mi carpeta de credito |
| 9 | C003|gracias por su ayuda buenos dias |
| 10 | ; RUN; |
| 1 | /* Los datos se cargan implícitamente mediante el paso |
| 2 | DATA anterior ejecutado en la caslib casuser */ |
| 1 | |
| 2 | PROC CAS; |
| 3 | langModel.calculateErrorRate / reference={name='llamadas_ref', caslib='casuser'} TABLE={name='llamadas_hyp', caslib='casuser'} referenceId='call_id' referenceText='transcript' tableId='call_id' tableText='transcript'; |
| 4 | |
| 5 | RUN; |
| 6 |
Se espera una tabla de resultados que muestre: Para C001, una eliminación ('mi'); para C002, una sustitución ('tarjeta' vs 'carpeta'); para C003, una coincidencia perfecta (WER=0). El sistema debe calcular las métricas globales de WER, CER y SER agregadas.