Veröffentlicht am :
Statistik CREATION_INTERNE

Dokumentationsbeispiel für PROC MODECLUS (modecex5)

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript initialisiert einen Datensatz namens 'test' mit einfachen numerischen Daten über einen DATA-Schritt und Datalines. Anschließend wird PROC MODECLUS zweimal ausgeführt. Die erste Ausführung verwendet Methode 6 mit einem Radius R von 2.5 und dem Standard-Schwellenwert (0.5). Die zweite Ausführung ändert den Schwellenwert auf 0.55. Für jede Ausführung von MODECLUS werden die Ergebnisse (Dichte und Cluster) in einem Ausgabedatensatz ('out') gespeichert und anschließend als Streudiagramm (scatter plot) mit PROC SGPLOT visualisiert, wobei die Dichte in Abhängigkeit von der Variable 'x' dargestellt und nach Cluster gruppiert wird. Dies ermöglicht den visuellen Vergleich der Auswirkungen verschiedener Schwellenwerte auf die Clusterbildung.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden direkt im SAS-Skript über einen DATA-Schritt und Datalines erstellt, in Form eines Datensatzes namens 'test' mit einer einzigen numerischen Variable 'x'.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellt einen SAS-Datensatz namens 'test' mit einer numerischen Variable 'x'. Die Werte für 'x' werden direkt im Skript über die DATALINES-Klausel bereitgestellt, wodurch ein eindimensionaler Datensatz für die Cluster-Analyse simuliert wird.
Kopiert!
1DATA test;
2 INPUT x;
3 DATALINES;
41 2 3 4 5 7.5 9 11.5 13 14.5 15 16
5;
2 Codeblock
PROC MODECLUS
Erklärung :
Führt eine Cluster-Analyse auf dem Datensatz 'test' unter Verwendung von PROC MODECLUS mit Methode 6 durch. Der Dichte-Radius 'r' ist auf 2.5 festgelegt, und die Option 'trace' zeigt detaillierte Informationen zur Dichte an. Die Option 'short' unterdrückt die Distanzmatrix. Der Standard-Clustering-Schwellenwert (0.5) wird verwendet. Der Ausgabedatensatz 'out' enthält die Variable 'x', die geschätzten Dichten und die Clusterzuweisung für jede Beobachtung.
Kopiert!
1/*-- METHOD=6 with TRACE and THRESHOLD=0.5 (default) --*/
2title 'METHOD=6 with TRACE and THRESHOLD=0.5 (default)';
3 
4PROC MODECLUS DATA=test method=6 r=2.5 trace short out=out;
5 var x;
6RUN;
3 Codeblock
PROC SGPLOT
Erklärung :
Erzeugt ein Streudiagramm (scatter plot) aus dem Datensatz 'out'. Die Y-Achse stellt die Dichte ('density') und die X-Achse die Variable 'x' dar. Die Punkte sind nach den identifizierten Clustern ('cluster') farblich gekennzeichnet und gruppiert, und jeder Punkt ist mit seiner Beobachtungsnummer ('_obs_') beschriftet, was die Visualisierung der Clustering-Ergebnisse erleichtert.
Kopiert!
1title2 'Plot of DENSITY*X=CLUSTER';
2 
3PROC SGPLOT DATA=out;
4 scatter y=density x=x / group=cluster datalabel=_obs_;
5RUN;
4 Codeblock
PROC MODECLUS
Erklärung :
Führt eine zweite Cluster-Analyse mit PROC MODECLUS durch, wobei der Datensatz 'test' und Methode 6 wiederverwendet werden. Diesmal wird ein 'threshold' (Schwellenwert) von 0.55 angegeben, der höher als der Standardwert ist. Diese Änderung soll zeigen, wie eine Anpassung des Schwellenwerts die Bildung und Anzahl der Cluster beeinflussen kann, die im Datensatz 'out' ausgegeben werden.
Kopiert!
1/*-- METHOD=6 with TRACE and THRESHOLD=0.55 --*/
2title 'METHOD=6 with TRACE and THRESHOLD=0.55';
3 
4PROC MODECLUS DATA=test method=6 r=2.5 trace threshold=0.55 short out=out;
5 var x;
6RUN;
5 Codeblock
PROC SGPLOT
Erklärung :
Erzeugt ein zweites Streudiagramm, um die Ergebnisse der zweiten Ausführung von PROC MODECLUS zu visualisieren, die einen Schwellenwert von 0.55 verwendet hat. Wie im vorherigen Diagramm wird die Dichte in Bezug auf 'x' dargestellt, gruppiert nach den neu gebildeten Clustern, was einen direkten Vergleich mit den Ergebnissen des Standard-Schwellenwerts ermöglicht.
Kopiert!
1title2 'Plot of DENSITY*X=CLUSTER with TRACE and THRESHOLD=0.55';
2 
3PROC SGPLOT DATA=out;
4 scatter y=density x=x / group=cluster datalabel=_obs_;
5RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y, NAME: modecex5, TITLE: Documentation Example 5 for PROC MODECLUS, PRODUCT: STAT