Scénario de test & Cas d'usage
Simulación de logs de navegación web con Timestamp (minutos desde el inicio).
| 1 | DATA casuser.web_logs; INPUT session_id tiempo_min pagina $; DATALINES; |
| 2 | 1 1 HOME |
| 3 | 1 5 DEPORTES |
| 4 | 1 120 POLITICA |
| 5 | 2 1 HOME |
| 6 | 2 3 DEPORTES |
| 7 | 2 10 FINANZAS |
| 8 | 3 1 HOME |
| 9 | 3 60 DEPORTES |
| 10 | 4 1 HOME |
| 11 | 4 4 DEPORTES |
| 12 | 4 8 FINANZAS |
| 13 | ; RUN; |
| 1 | PROC CAS; |
| 2 | sequence.cspade / |
| 3 | TABLE={name="web_logs", caslib="casuser"} |
| 4 | sequenceId="session_id" |
| 5 | eventId="tiempo_min" |
| 6 | itemId="pagina" |
| 7 | support=0.5 |
| 8 | minGap=1 |
| 9 | maxGap=10 |
| 10 | casout={name="flujo_rapido", caslib="casuser", replace=true}; |
| 11 | QUIT; |
La tabla 'flujo_rapido' debe identificar la secuencia (HOME -> DEPORTES) como frecuente, pero debe excluir casos donde el tiempo entre clics supere los 10 minutos (como en la sesión 1 entre DEPORTES y POLITICA, o sesión 3), validando que los parámetros minGap y maxGap filtran correctamente los eventos.