Veröffentlicht am :
Statistik SASHELP

Beispiel einer kanonischen Diskriminanzanalyse mit PROC HPCANDISC

Dieser Code ist auch verfügbar auf: English Español Français
Dieses SAS©-Skript veranschaulicht die Verwendung der Prozedur HPCANDISC zur Durchführung einer kanonischen Diskriminanzanalyse am Fisher-Iris-Datensatz. Anschließend wird ein Streudiagramm der kanonischen Variablen 1 und 2, gruppiert nach Spezies, mit Hilfe von PROC TEMPLATE und PROC SGRENDER erstellt. Dieser Prozess ermöglicht die Visualisierung der Trennung zwischen den Gruppen basierend auf linearen Kombinationen von Variablen, die die Diskriminierung maximieren.
Datenanalyse

Type : SASHELP


Die Daten stammen aus der SASHELP-Bibliothek, insbesondere dem IRIS-Datensatz, der ein öffentlicher Standarddatensatz für die Diskriminanzanalyse ist.

1 Codeblock
PROC HPCANDISC
Erklärung :
Dieser Block führt die HPCANDISC-Prozedur für eine kanonische Diskriminanzanalyse aus. Er verwendet die Daten `sashelp.iris` als Eingabe, speichert die kanonischen Ergebnisse (Scores und Koeffizienten) in einem neuen Datensatz namens `outcan`, berechnet die Mahalanobis-Distanzen und führt eine Varianzanalyse durch. Die Variable `Species` wird als Identifikationsvariable für Beobachtungen und zur Klassifizierung von Gruppen verwendet, während `SepalLength`, `SepalWidth`, `PetalLength` und `PetalWidth` die quantitativen Variablen sind, die für die Diskriminierung verwendet werden.
Kopiert!
1PROC HPCANDISC DATA=sashelp.iris out=outcan distance anova;
2 id Species;
3 class Species;
4 var SepalLength SepalWidth PetalLength PetalWidth;
5RUN;
2 Codeblock
PROC TEMPLATE
Erklärung :
Dieser Block verwendet PROC TEMPLATE, um ein benutzerdefiniertes Grafikmodell (`statgraph`) namens `scatter` zu definieren. Dieses Modell erstellt ein Streudiagramm (`scatterplot`), das die ersten beiden kanonischen Variablen (`Can1`, `Can2`), die aus PROC HPCANDISC resultieren, visualisiert. Die Punkte werden nach der Variable `species` gruppiert und gefärbt. Das Diagramm enthält einen Haupttitel, benutzerdefinierte Achsenoptionen und eine diskrete Legende für die Speziesgruppen.
Kopiert!
1PROC TEMPLATE;
2 define statgraph scatter;
3 begingraph;
4 entrytitle 'Fisher (1936) Iris Data';
5 layout overlayequated / equatetype=fit
6 xaxisopts=(label='Canonical Variable 1')
7 yaxisopts=(label='Canonical Variable 2');
8 scatterplot x=Can1 y=Can2 / group=species name='iris';
9 layout gridded / autoalign=(topleft);
10 discretelegend 'iris' / border=false opaque=false;
11 endlayout;
12 endlayout;
13 endgraph;
14 END;
15RUN;
3 Codeblock
PROC SGRENDER
Erklärung :
Dieser Block verwendet PROC SGRENDER, um das zuvor durch das `scatter`-Modell definierte Diagramm zu generieren. Er verwendet den Datensatz `outcan` (erstellt von PROC HPCANDISC und enthaltend die kanonischen Variablen) als Datenquelle für das Rendering, wodurch die Visualisierung der Speziesgruppen im Raum der kanonischen Variablen erzeugt wird.
Kopiert!
1PROC SGRENDER DATA=outcan template=scatter;
2RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y