simple correlation

Hochvolumige Sensor-Validierung in der Fertigung

Scénario de test & Cas d'usage

Geschäftskontext

Eine Smart-Factory sammelt Daten von Tausenden von Sensoren an verschiedenen Maschinentypen. Um prädiktive Wartungsmodelle zu validieren, müssen Ingenieure die Korrelation zwischen Temperatur und Druck für jede Maschinengruppe (Group-By) berechnen. Der Test prüft die Leistung bei großen Datenmengen und die Group-By-Funktionalität.
Datenaufbereitung

Simulation von 100.000 Sensor-Log-Einträgen mit Maschinengruppen.

Kopiert!
1DATA casuser.sensor_logs;
2 DO i=1 to 100000;
3 machine_id = mod(i, 5);
4 temperature = 50 + 10*rand('normal');
5 pressure = 100 + 20*rand('normal') + (temperature * 0.5);
6 vibration = rand('uniform');
7 OUTPUT;
8 END;
9RUN;

Étapes de réalisation

1
Berechnung der Korrelation gruppiert nach Maschinentyp mit spezifischem Varianz-Divisor.
Kopiert!
1PROC CAS;
2 SIMPLE.correlation /
3 TABLE={name='sensor_logs', groupBy={{name='machine_id'}}}
4 inputs={{name='temperature'}, {name='pressure'}}
5 varianceDivisor='N'
6 groupByLimit=100
7 outputTables={names={'corr_by_machine'}};
8RUN;

Erwartetes Ergebnis


Die Aktion verarbeitet die 100.000 Zeilen effizient und liefert separate Korrelationsmatrizen für jede `machine_id`. Der Divisor 'N' wird für die Varianzberechnung verwendet.