pca

eig

Beschreibung

Extrahiert Hauptkomponenten unter Verwendung der Eigenwertzerlegungsmethode.

Einstellungen
ParameterBeschreibung
attributesÄndert die Attribute der in dieser Aktion verwendeten Variablen.
codeSchreibt SAS DATA Step-Code zur Berechnung der vorhergesagten Werte des angepassten Modells.
covWenn auf True gesetzt, werden die Hauptkomponenten aus der Kovarianzmatrix berechnet.
displayGibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
freqGibt eine numerische Variable an, die die Häufigkeit des Auftretens jeder Beobachtung enthält.
gpuGibt die Einstellungen für Grafikprozessoren (GPUs) an.
groupbyLimitUnterdrückt die Analyse, wenn die Anzahl der BY-Gruppen den angegebenen Wert überschreitet.
inputsGibt die zu analysierenden Variablen an.
nGibt die Anzahl der zu berechnenden Hauptkomponenten an.
noIntWenn auf True gesetzt, wird der Achsenabschnitt (Intercept) aus dem Modell weggelassen.
outputGibt die Ausgabetabelle an, die erstellt werden soll, um beobachtungsweise Statistiken zu enthalten.
outputTablesListet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
outStatGibt die Ausgabetabelle an, die verschiedene Statistiken enthalten soll, einschließlich Mittelwerte, Standardabweichungen, Eigenwerte und Eigenvektoren.
partialGibt numerische Variablen an, die herausgerechnet werden sollen, wenn Sie eine partielle Korrelations- oder Kovarianzmatrix analysieren möchten.
prefixGibt ein Präfix für die Benennung der Hauptkomponenten an.
singularGibt das Singularitätskriterium an.
stdWenn auf True gesetzt, werden die Hauptkomponentenscores in der im Parameter output angegebenen Ausgabetabelle auf Einheitsvarianz standardisiert.
storeGibt die Ausgabetabelle an, die erstellt werden soll, um Modellanpassungsinformationen zu speichern, die Sie für das Scoring verwenden können.
tableGibt die Einstellungen für eine Eingabetabelle an.
varDefGibt den Divisor an, der bei der Berechnung von Varianzen und Standardabweichungen verwendet werden soll.
weightGibt eine numerische Variable an, die als Gewichtung für eine gewichtete Analyse der Daten verwendet wird.
Datenvorbereitung

Laden eines Beispieldatensatzes (z.B. Iris) in die aktive CAS-Sitzung, um die Analyse durchzuführen.

Kopiert!
1 
2PROC CAS;
3loadTable path="iris.sas7bdat" caslib="samples" casout="iris";
4RUN;
5 

Beispiele

Führt eine PCA auf der Tabelle 'iris' durch, um Eigenwerte und Eigenvektoren zu berechnen.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 pca.eig TABLE={name="iris"};
3RUN;
Ergebnis :
Die Aktion erzeugt Standard-PCA-Ergebnistabellen wie Eigenwerte und Eigenvektoren für alle numerischen Variablen.

Führt eine PCA auf spezifischen Variablen durch, extrahiert die ersten zwei Komponenten und speichert die Scores.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 pca.eig
3 TABLE={name="iris"}
4 n=2
5 inputs={"SepalLength", "SepalWidth", "PetalLength", "PetalWidth"}
6 OUTPUT={casOut={name="pca_scores", replace=true}, score="PC"};
7RUN;
Ergebnis :
Es werden nur 2 Komponenten extrahiert. Die Tabelle 'pca_scores' wird erstellt und enthält die Scores mit dem Präfix 'PC'.

FAQ

Was ist der Zweck der Aktion eig?
Wie kann ich Hauptkomponenten aus der Kovarianzmatrix anstelle der Korrelationsmatrix berechnen?
Wie lege ich die Anzahl der zu berechnenden Hauptkomponenten fest?
Wie kann ich spezifische Variablen für die Analyse auswählen?
Wie kann ich SAS DATA Step-Code für das Scoring generieren?
Wie kann ich den Achsenabschnitt (Intercept) aus dem Modell ausschließen?
Wie speichere ich Statistiken wie Mittelwerte, Standardabweichungen, Eigenwerte und Eigenvektoren?
Wie kann ich die Hauptkomponenten-Scores standardisieren?
Wie speichere ich Modellanpassungsinformationen für späteres Scoring?
Kann ich eine gewichtete Analyse durchführen?

Zugehörige Szenarien

Anwendungsfall
Standardanalyse zur Kundensegmentierung

Eine Bank möchte ihre Kundenbasis basierend auf Finanzkennzahlen (Einkommen, Schulden, Ausgaben) segmentieren. Ziel ist es, die Dimensionalität der Daten zu reduzieren, um Clust...

Anwendungsfall
Leistungsanalyse von IoT-Sensordaten

In einer Fertigungsstraße generieren Tausende von Sensoren kontinuierlich Daten. Ingenieure wollen das Rauschen reduzieren und die Hauptvariationsquellen mithilfe der Kovarianzm...

Anwendungsfall
Gewichtete Analyse mit fehlenden Werten

Ein Forschungsinstitut analysiert Umfragedaten. Einige Antworten fehlen (Missing Values), und bestimmte demografische Gruppen müssen stärker gewichtet werden, um repräsentativ z...