simple correlation

Correlación ponderada de sensores industriales con limpieza de datos

Scénario de test & Cas d'usage

Contexto empresarial

Una planta química monitorea la presión y temperatura de sus reactores. Las lecturas tienen una duración variable (peso). Debido a errores de calibración, algunos sensores reportan duraciones negativas (datos inválidos) que deben ser excluidos automáticamente para no sesgar el cálculo de la covarianza ponderada.
Preparación de datos

Simulación de lecturas de sensores con variable de duración (peso), incluyendo valores negativos erróneos.

¡Copiado!
1 
2DATA mycas.reactor_sensors;
3call streaminit(999);
4DO i = 1 to 1000;
5pressure = rand('Normal', 100, 10);
6temp = 200 + (pressure * 0.5) + rand('Normal', 0, 5);
7duration = rand('Normal', 60, 15);
8IF i > 950 THEN duration = -1 * duration;
9/* Simular errores */ OUTPUT;
10END;
11 
12RUN;
13 

Étapes de réalisation

1
Ejecución de correlación ponderada excluyendo pesos no positivos y definiendo el divisor de varianza.
¡Copiado!
1 
2PROC CAS;
3SIMPLE.correlation / TABLE={name='reactor_sensors'}, inputs={{name='pressure'}, {name='temp'}}, weight='duration', excludeNonPosWgt=true, varianceDivisor='WDF';
4 
5RUN;
6 

Resultado esperado


La acción debe filtrar automáticamente las observaciones donde 'duration' es negativa (los últimos 50 registros simulados) y calcular la correlación entre presión y temperatura utilizando la suma de los pesos menos uno (WDF) como divisor. Se espera un mensaje en el log indicando la exclusión de filas.