spc boxChart

Analyse mit ungleichen Untergruppengrößen und fehlenden Werten

Scénario de test & Cas d'usage

Geschäftskontext

Ein Energieversorger überwacht die Spannungsschwankungen im Stromnetz. Die Daten werden von verschiedenen Sensoren erfasst, die gelegentlich ausfallen, was zu fehlenden Werten und Untergruppen (stündliche Messungen) mit unterschiedlichen Stichprobengrößen führt. Dieses Szenario testet die Robustheit der `boxChart`-Aktion bei unvollständigen Daten.
Über das Set : spc

Statistische Prozesslenkung (Regelkarten).

Entdecken Sie alle Aktionen von spc
Datenaufbereitung

Erstellt eine Tabelle 'Netzspannung' mit variablen Anzahlen von Messungen pro Stunde. Einige Stunden haben weniger als die nominale Größe von 5, und für einige Messungen wird ein fehlender Wert ('.') eingefügt.

Kopiert!
1DATA Netzspannung;
2 FORMAT Zeitstempel datetime.;
3 DO Tag = 1 to 2;
4 DO Stunde = 0 to 23;
5 AnzahlMessungen = floor(ranuni(567)*5) + 1; \* 1 bis 5 Messungen
6 DO i = 1 to AnzahlMessungen;
7 Zeitstempel = dhms(mdy(1,1,2024), Stunde, 0, 0);
8 IF ranuni(888) > 0.9 THEN Spannung = .; \* 10% fehlende Werte
9 ELSE Spannung = 230.5 + rannor(999);
10 OUTPUT;
11 END;
12 END;
13 END;
14RUN;

Étapes de réalisation

1
Laden der unvollständigen Sensordaten in CAS.
Kopiert!
1 
2PROC CASUTIL;
3load
4DATA=Netzspannung outcaslib='casuser' casout='netzspannung_sensoren' replace;
5QUIT;
6 
2
Ausführen der `boxChart`-Aktion mit `limitN=5` und `allN=TRUE`. `allN` stellt sicher, dass auch Untergruppen mit weniger als 5 Messungen verarbeitet werden. `controlStat='MEDIAN'` wird verwendet, da Mediane robuster gegenüber Ausreißern sind, die in Sensordaten häufig vorkommen.
Kopiert!
1PROC CAS;
2 spc.boxChart /
3 TABLE={name='netzspannung_sensoren'},
4 processValue='Spannung',
5 subgroupValue='Zeitstempel',
6 limitN=5,
7 allN=TRUE,
8 controlStat='MEDIAN';
9RUN;

Erwartetes Ergebnis


Die Aktion sollte ohne Fehler durchlaufen. Die Kontrollgrenzen im Diagramm und in der Ausgabetabelle 'ControlLimits' sollten variieren, um die unterschiedlichen Stichprobengrößen der Untergruppen widerzuspiegeln. Die Tabelle 'ControlChart' sollte für jede Untergruppe die tatsächliche Stichprobengröße in der Spalte '_SUBSIZE_' anzeigen. Fehlende Werte in der Prozessvariablen 'Spannung' werden von der Berechnung ignoriert.