sequence cspade

Optimización de Flujo Web con Restricciones de Tiempo (Gap)

Scénario de test & Cas d'usage

Contexto empresarial

Un portal de noticias quiere analizar la navegación de los usuarios, pero solo le interesan las lecturas consecutivas rápidas (noticias leídas en la misma sesión o con poco intervalo). Se necesita filtrar patrones donde el tiempo entre clics sea demasiado largo o demasiado corto, usando restricciones de 'Gap'.
Preparación de datos

Simulación de logs de navegación web con Timestamp (minutos desde el inicio).

¡Copiado!
1DATA casuser.web_logs; INPUT session_id tiempo_min pagina $; DATALINES;
21 1 HOME
31 5 DEPORTES
41 120 POLITICA
52 1 HOME
62 3 DEPORTES
72 10 FINANZAS
83 1 HOME
93 60 DEPORTES
104 1 HOME
114 4 DEPORTES
124 8 FINANZAS
13; RUN;

Étapes de réalisation

1
Ejecución con restricciones de brecha temporal (minGap y maxGap).
¡Copiado!
1PROC CAS;
2 sequence.cspade /
3 TABLE={name="web_logs", caslib="casuser"}
4 sequenceId="session_id"
5 eventId="tiempo_min"
6 itemId="pagina"
7 support=0.5
8 minGap=1
9 maxGap=10
10 casout={name="flujo_rapido", caslib="casuser", replace=true};
11QUIT;

Resultado esperado


La tabla 'flujo_rapido' debe identificar la secuencia (HOME -> DEPORTES) como frecuente, pero debe excluir casos donde el tiempo entre clics supere los 10 minutos (como en la sesión 1 entre DEPORTES y POLITICA, o sesión 3), validando que los parámetros minGap y maxGap filtran correctamente los eventos.