Scénario de test & Cas d'usage
Gestión de grandes modelos de lenguaje (LLM) y PNL.
Descubrir todas las acciones de langModelGeneración sintética de 100,000 registros para simular una carga de trabajo masiva.
| 1 | |
| 2 | DATA casuser.big_ref; |
| 3 | LENGTH seg_id $ 20 content $ 100; |
| 4 | DO i=1 to 100000; |
| 5 | seg_id=cats('SEG_', i); |
| 6 | content='este es el contenido original del segmento numero ' || cats(i); |
| 7 | OUTPUT; |
| 8 | END; |
| 9 | |
| 10 | RUN; |
| 11 | DATA casuser.big_hyp; |
| 12 | LENGTH seg_id $ 20 content $ 100; |
| 13 | DO i=1 to 100000; |
| 14 | seg_id=cats('SEG_', i); |
| 15 | IF rand('UNIFORM') > 0.8 THEN content='este es el contenido predicho del segmento numero ' || cats(i); |
| 16 | ELSE content='este es el contenido original del segmento numero ' || cats(i); |
| 17 | OUTPUT; |
| 18 | END; |
| 19 | |
| 20 | RUN; |
| 21 |
| 1 | PROC CAS; TABLE.tableInfo / caslib='casuser'; RUN; |
| 1 | |
| 2 | PROC CAS; |
| 3 | langModel.calculateErrorRate / reference={name='big_ref', caslib='casuser'} TABLE={name='big_hyp', caslib='casuser'} referenceId='seg_id' referenceText='content' tableId='seg_id' tableText='content'; |
| 4 | |
| 5 | RUN; |
| 6 |
La acción debe completarse exitosamente en un tiempo razonable. El resultado debe reflejar un WER bajo (dado que el 80% de los datos son idénticos en la simulación) y confirmar que se procesaron las 100,000 filas sin errores de memoria.