pca

eig

Beschreibung

Extrahiert Hauptkomponenten unter Verwendung der Eigenwertzerlegungsmethode.

Einstellungen
ParameterBeschreibung
attributes Ändert die Attribute der in dieser Aktion verwendeten Variablen.
code Schreibt SAS DATA Step-Code zur Berechnung der vorhergesagten Werte des angepassten Modells.
cov Wenn auf True gesetzt, werden die Hauptkomponenten aus der Kovarianzmatrix berechnet.
display Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
freq Gibt eine numerische Variable an, die die Häufigkeit des Auftretens jeder Beobachtung enthält.
gpu Gibt die Einstellungen für Grafikprozessoren (GPUs) an.
groupbyLimit Unterdrückt die Analyse, wenn die Anzahl der BY-Gruppen den angegebenen Wert überschreitet.
inputs Gibt die zu analysierenden Variablen an.
n Gibt die Anzahl der zu berechnenden Hauptkomponenten an.
noInt Wenn auf True gesetzt, wird der Achsenabschnitt (Intercept) aus dem Modell weggelassen.
output Gibt die Ausgabetabelle an, die erstellt werden soll, um beobachtungsweise Statistiken zu enthalten.
outputTables Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
outStat Gibt die Ausgabetabelle an, die verschiedene Statistiken enthalten soll, einschließlich Mittelwerte, Standardabweichungen, Eigenwerte und Eigenvektoren.
partial Gibt numerische Variablen an, die herausgerechnet werden sollen, wenn Sie eine partielle Korrelations- oder Kovarianzmatrix analysieren möchten.
prefix Gibt ein Präfix für die Benennung der Hauptkomponenten an.
singular Gibt das Singularitätskriterium an.
std Wenn auf True gesetzt, werden die Hauptkomponentenscores in der im Parameter output angegebenen Ausgabetabelle auf Einheitsvarianz standardisiert.
store Gibt die Ausgabetabelle an, die erstellt werden soll, um Modellanpassungsinformationen zu speichern, die Sie für das Scoring verwenden können.
table Gibt die Einstellungen für eine Eingabetabelle an.
varDef Gibt den Divisor an, der bei der Berechnung von Varianzen und Standardabweichungen verwendet werden soll.
weight Gibt eine numerische Variable an, die als Gewichtung für eine gewichtete Analyse der Daten verwendet wird.
Datenvorbereitung

Laden eines Beispieldatensatzes (z.B. Iris) in die aktive CAS-Sitzung, um die Analyse durchzuführen.

Kopiert!
1 
2PROC CAS;
3loadTable path="iris.sas7bdat" caslib="samples" casout="iris";
4RUN;
5 

Beispiele

Führt eine PCA auf der Tabelle 'iris' durch, um Eigenwerte und Eigenvektoren zu berechnen.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 pca.eig TABLE={name="iris"};
3RUN;
Ergebnis :
Die Aktion erzeugt Standard-PCA-Ergebnistabellen wie Eigenwerte und Eigenvektoren für alle numerischen Variablen.

Führt eine PCA auf spezifischen Variablen durch, extrahiert die ersten zwei Komponenten und speichert die Scores.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 pca.eig
3 TABLE={name="iris"}
4 n=2
5 inputs={"SepalLength", "SepalWidth", "PetalLength", "PetalWidth"}
6 OUTPUT={casOut={name="pca_scores", replace=true}, score="PC"};
7RUN;
Ergebnis :
Es werden nur 2 Komponenten extrahiert. Die Tabelle 'pca_scores' wird erstellt und enthält die Scores mit dem Präfix 'PC'.

FAQ

Was ist der Zweck der Aktion eig?
Wie kann ich Hauptkomponenten aus der Kovarianzmatrix anstelle der Korrelationsmatrix berechnen?
Wie lege ich die Anzahl der zu berechnenden Hauptkomponenten fest?
Wie kann ich spezifische Variablen für die Analyse auswählen?
Wie kann ich SAS DATA Step-Code für das Scoring generieren?
Wie kann ich den Achsenabschnitt (Intercept) aus dem Modell ausschließen?
Wie speichere ich Statistiken wie Mittelwerte, Standardabweichungen, Eigenwerte und Eigenvektoren?
Wie kann ich die Hauptkomponenten-Scores standardisieren?
Wie speichere ich Modellanpassungsinformationen für späteres Scoring?
Kann ich eine gewichtete Analyse durchführen?

Zugehörige Szenarien

Anwendungsfall
Standardanalyse zur Kundensegmentierung

Eine Bank möchte ihre Kundenbasis basierend auf Finanzkennzahlen (Einkommen, Schulden, Ausgaben) segmentieren. Ziel ist es, die Dimensionalität der Daten zu reduzieren, um Clust...

Anwendungsfall
Leistungsanalyse von IoT-Sensordaten

In einer Fertigungsstraße generieren Tausende von Sensoren kontinuierlich Daten. Ingenieure wollen das Rauschen reduzieren und die Hauptvariationsquellen mithilfe der Kovarianzm...

Anwendungsfall
Gewichtete Analyse mit fehlenden Werten

Ein Forschungsinstitut analysiert Umfragedaten. Einige Antworten fehlen (Missing Values), und bestimmte demografische Gruppen müssen stärker gewichtet werden, um repräsentativ z...