Das Skript initialisiert einen Datensatz namens 'test' mit einfachen numerischen Daten über einen DATA-Schritt und Datalines. Anschließend wird PROC MODECLUS zweimal ausgeführt. Die erste Ausführung verwendet Methode 6 mit einem Radius R von 2.5 und dem Standard-Schwellenwert (0.5). Die zweite Ausführung ändert den Schwellenwert auf 0.55. Für jede Ausführung von MODECLUS werden die Ergebnisse (Dichte und Cluster) in einem Ausgabedatensatz ('out') gespeichert und anschließend als Streudiagramm (scatter plot) mit PROC SGPLOT visualisiert, wobei die Dichte in Abhängigkeit von der Variable 'x' dargestellt und nach Cluster gruppiert wird. Dies ermöglicht den visuellen Vergleich der Auswirkungen verschiedener Schwellenwerte auf die Clusterbildung.
Datenanalyse
Type : CREATION_INTERNE
Die Daten werden direkt im SAS-Skript über einen DATA-Schritt und Datalines erstellt, in Form eines Datensatzes namens 'test' mit einer einzigen numerischen Variable 'x'.
1 Codeblock
DATA STEP Data
Erklärung : Erstellt einen SAS-Datensatz namens 'test' mit einer numerischen Variable 'x'. Die Werte für 'x' werden direkt im Skript über die DATALINES-Klausel bereitgestellt, wodurch ein eindimensionaler Datensatz für die Cluster-Analyse simuliert wird.
Erklärung : Führt eine Cluster-Analyse auf dem Datensatz 'test' unter Verwendung von PROC MODECLUS mit Methode 6 durch. Der Dichte-Radius 'r' ist auf 2.5 festgelegt, und die Option 'trace' zeigt detaillierte Informationen zur Dichte an. Die Option 'short' unterdrückt die Distanzmatrix. Der Standard-Clustering-Schwellenwert (0.5) wird verwendet. Der Ausgabedatensatz 'out' enthält die Variable 'x', die geschätzten Dichten und die Clusterzuweisung für jede Beobachtung.
Kopiert!
/*-- METHOD=6 with TRACE and THRESHOLD=0.5 (default) --*/
title 'METHOD=6 with TRACE and THRESHOLD=0.5 (default)';
proc modeclus data=test method=6 r=2.5 trace short out=out;
var x;
run;
1
/*-- METHOD=6 with TRACE and THRESHOLD=0.5 (default) --*/
2
title 'METHOD=6 with TRACE and THRESHOLD=0.5 (default)';
3
4
PROC MODECLUSDATA=test method=6 r=2.5 trace short out=out;
5
var x;
6
RUN;
3 Codeblock
PROC SGPLOT
Erklärung : Erzeugt ein Streudiagramm (scatter plot) aus dem Datensatz 'out'. Die Y-Achse stellt die Dichte ('density') und die X-Achse die Variable 'x' dar. Die Punkte sind nach den identifizierten Clustern ('cluster') farblich gekennzeichnet und gruppiert, und jeder Punkt ist mit seiner Beobachtungsnummer ('_obs_') beschriftet, was die Visualisierung der Clustering-Ergebnisse erleichtert.
Erklärung : Führt eine zweite Cluster-Analyse mit PROC MODECLUS durch, wobei der Datensatz 'test' und Methode 6 wiederverwendet werden. Diesmal wird ein 'threshold' (Schwellenwert) von 0.55 angegeben, der höher als der Standardwert ist. Diese Änderung soll zeigen, wie eine Anpassung des Schwellenwerts die Bildung und Anzahl der Cluster beeinflussen kann, die im Datensatz 'out' ausgegeben werden.
Kopiert!
/*-- METHOD=6 with TRACE and THRESHOLD=0.55 --*/
title 'METHOD=6 with TRACE and THRESHOLD=0.55';
proc modeclus data=test method=6 r=2.5 trace threshold=0.55 short out=out;
var x;
run;
1
/*-- METHOD=6 with TRACE and THRESHOLD=0.55 --*/
2
title 'METHOD=6 with TRACE and THRESHOLD=0.55';
3
4
PROC MODECLUSDATA=test method=6 r=2.5 trace threshold=0.55 short out=out;
5
var x;
6
RUN;
5 Codeblock
PROC SGPLOT
Erklärung : Erzeugt ein zweites Streudiagramm, um die Ergebnisse der zweiten Ausführung von PROC MODECLUS zu visualisieren, die einen Schwellenwert von 0.55 verwendet hat. Wie im vorherigen Diagramm wird die Dichte in Bezug auf 'x' dargestellt, gruppiert nach den neu gebildeten Clustern, was einen direkten Vergleich mit den Ergebnissen des Standard-Schwellenwerts ermöglicht.
Kopiert!
title2 'Plot of DENSITY*X=CLUSTER with TRACE and THRESHOLD=0.55';
proc sgplot data=out;
scatter y=density x=x / group=cluster datalabel=_obs_;
run;
1
title2 'Plot of DENSITY*X=CLUSTER with TRACE and THRESHOLD=0.55';
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y, NAME: modecex5, TITLE: Documentation Example 5 for PROC MODECLUS, PRODUCT: STAT
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.