simple crossTab

Análisis de Volumen de Latencia de Red con Discretización (Binning)

Scénario de test & Cas d'usage

Contexto empresarial

Una empresa de telecomunicaciones necesita analizar registros masivos de latencia de red. La latencia es una variable continua y se desea ver su distribución cruzada con la región del servidor. Dado que hay millones de valores únicos de latencia, es crítico probar la capacidad de la acción para agrupar (binning) esta variable numérica automáticamente y calcular la latencia promedio por región.
Preparación de datos

Generación de un gran volumen de datos (100,000 filas) simulando latencias de red continuas.

¡Copiado!
1 
2DATA casuser.network_logs;
3call streaminit(99);
4array regs[4] $5 ('North' 'South' 'East' 'West');
5DO i=1 to 100000;
6Region = regs[rand('Integer', 1, 4)];
7Latency_ms = rand('Normal', 50, 15);
8PacketLoss = rand('Uniform', 0, 1);
9OUTPUT;
10END;
11 
12RUN;
13 

Étapes de réalisation

1
Ejecución de CrossTab utilizando 'niceBinning' y 'rowNBins' para manejar la variable continua de latencia.
¡Copiado!
1 
2PROC CAS;
3SIMPLE.crossTab / TABLE={name="network_logs"} row="Latency_ms" rowNBins=10 niceBinning=true col="Region" weight="PacketLoss" aggregator="MEAN";
4 
5RUN;
6 

Resultado esperado


La acción debe manejar el alto volumen de datos sin errores. La variable continua 'Latency_ms' debe aparecer agrupada en 10 intervalos legibles (bins) en las filas. Las celdas deben mostrar el promedio (MEAN) de 'PacketLoss' por cada intervalo de latencia y región, demostrando la capacidad de resumir grandes volúmenes de datos numéricos.