simple

correlation

Beschreibung

Die Aktion `simple.correlation` berechnet Pearson-Produkt-Moment-Korrelationen zwischen numerischen Variablen in einer CAS-Tabelle. Sie bietet auch deskriptive Statistiken, Kovarianzen und andere zugehörige Maße. Diese Aktion ist grundlegend für die explorative Datenanalyse, um die linearen Beziehungen zwischen Variablen zu verstehen.

simple.correlation <result=results> <status=rc> / alpha=TRUE | FALSE, attributes={{casinvardesc-1} <, {casinvardesc-2}, ...>}, casOut={casouttable}, covariance=TRUE | FALSE, csscp=TRUE | FALSE, descriptiveStats=TRUE | FALSE, display={displayTables}, excludeNonPosWgt=TRUE | FALSE, excludePairStats=TRUE | FALSE, excludeProbs=TRUE | FALSE, freq="variable-name", groupByLimit=64-bit-integer, groupbyTable={groupbytable}, inputs={{casinvardesc-1} <, {casinvardesc-2}, ...>}, listwiseDelMiss=TRUE | FALSE, outputTables={outputTables}, pairWithInput={{casinvardesc-1} <, {casinvardesc-2}, ...>}, pearsonOut={casouttable}, rank=TRUE | FALSE, sscp=TRUE | FALSE, * table={castable}, topCorrelation=integer, varianceDivisor="DF" | "N" | "WDF" | "WEIGHT", varInfo=TRUE | FALSE, weight="variable-name";
Einstellungen
ParameterBeschreibung
alpha Wenn auf True gesetzt, berechnet Cronbachs Alpha-Koeffizienten.
attributes Gibt die Variablenattribute an.
casOut Gibt die Einstellungen für eine Ausgabetabelle an.
covariance Wenn auf True gesetzt, erstellt eine Tabelle der Varianz-/Kovarianzmatrix.
csscp Wenn auf True gesetzt, erstellt eine Tabelle der korrigierten Summe der Quadrate und Kreuzprodukte.
descriptiveStats Wenn auf True gesetzt, werden univariate deskriptive Statistiken für die Analysevariablen generiert.
display Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
excludeNonPosWgt Wenn auf True gesetzt, schließt Beobachtungen mit nicht-positiven Gewichtungswerten von der Analyse aus.
excludePairStats Wenn auf True gesetzt, unterdrückt die Anzeige von Statistiken, die mit dem paarweisen Ausschluss von fehlenden Werten verbunden sind.
excludeProbs Wenn auf True gesetzt, unterdrückt die Berechnung der Wahrscheinlichkeiten, die mit jedem Korrelationskoeffizienten verbunden sind.
freq Gibt eine numerische Variable an, die die Häufigkeit des Vorkommens jeder Beobachtung enthält.
groupByLimit Gibt die maximale Anzahl von Stufen in einer Group-By-Menge an. Wenn der Server diese Anzahl von Stufen erreicht, stoppt er und gibt kein Ergebnis zurück.
groupbyTable Gibt eine Eingabetabelle an, die die Gruppen für eine Group-By-Analyse enthält.
inputs Gibt die Eingabevariablen für die Analyse an.
listwiseDelMiss Wenn auf True gesetzt, wird der listenweise Ausschluss auf Beobachtungen mit fehlenden Werten angewendet.
outputTables Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
pairWithInput Gibt die numerischen Variablen an, mit denen Korrelationen der Variablen des INPUT-Parameters berechnet werden sollen.
pearsonOut Gibt eine Ausgabetabelle an, die die angeforderten Statistiken enthalten soll.
rank Wenn auf True gesetzt, zeigt geordnete Korrelationskoeffizienten an.
sscp Wenn auf True gesetzt, erstellt eine Tabelle der Summe der Quadrate und Kreuzprodukte.
table Gibt die zu verwendende CAS-Eingabetabelle an.
topCorrelation Gibt die Anzahl der anzuzeigenden geordneten Korrelationskoeffizienten an.
varianceDivisor Gibt den Divisor für die Varianz bei der Berechnung von Varianzen und Kovarianzen an.
varInfo Wenn auf True gesetzt, erstellt eine Tabelle mit Variableninformationen.
weight Gibt eine numerische Variable an, die als Gewichtung bei der Berechnung der gewichteten Pearson-Produkt-Moment-Korrelation verwendet wird.
Datenerstellung

Diese Anweisungen laden die Tabelle `cars` aus der `sashelp`-Bibliothek in Ihre `mycas`-Caslib, um sie in den Beispielen zu verwenden.

Kopiert!
1DATA mycas.cars;
2 SET sashelp.cars;
3RUN;

Beispiele

Dieses Beispiel berechnet die Pearson-Korrelationskoeffizienten für die numerischen Variablen `MPG_City`, `MPG_Highway`, `Weight` und `Horsepower` in der Tabelle `mycas.cars`.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 SIMPLE.correlation /
3 TABLE={name='cars'}
4 inputs={{name='MPG_City'}, {name='MPG_Highway'}, {name='Weight'}, {name='Horsepower'}};
5RUN;
Ergebnis :
Die Ausgabe enthält eine Korrelationsmatrix, die die Pearson-Korrelationskoeffizienten zwischen den angegebenen Variablen anzeigt, sowie deskriptive Statistiken für jede Variable.

Dieses Beispiel berechnet Korrelationen, Kovarianzen und Cronbachs Alpha für eine Auswahl von Variablen. Es verwendet die listenweise Löschung für fehlende Werte (`listwiseDelMiss=true`) und speichert die Pearson-Korrelationsergebnisse in einer neuen CAS-Tabelle namens `corr_results`.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 SIMPLE.correlation /
3 TABLE={name='cars'}
4 inputs={{name='MSRP'}, {name='Invoice'}, {name='EngineSize'}, {name='Cylinders'}, {name='Horsepower'}, {name='Weight'}}
5 listwiseDelMiss=true
6 covariance=true
7 alpha=true
8 pearsonOut={name='corr_results', replace=true};
9RUN;
Ergebnis :
Die Ausgabe umfasst deskriptive Statistiken, die Kovarianzmatrix, Cronbachs Alpha-Koeffizienten und die Pearson-Korrelationsmatrix. Zusätzlich wird eine neue CAS-Tabelle `corr_results` in der aktuellen Caslib erstellt, die die Korrelationsergebnisse enthält.

FAQ

Was ist der Zweck der `correlation`-Aktion?
Wie kann ich Cronbachs Alpha-Koeffizienten mit der `correlation`-Aktion berechnen?
Was bewirkt der `covariance`-Parameter, wenn er auf True gesetzt ist?
Wie kann ich eine Tabelle der korrigierten Summe der Quadrate und Kreuzprodukte (CSSCP) erhalten?
Ist es möglich, deskriptive Statistiken mit der `correlation`-Aktion zu generieren?
Wie gebe ich eine Gewichtungsvariable für die Korrelationsberechnung an?
Welchen Zweck hat der `varianceDivisor`-Parameter?

Zugehörige Szenarien

Anwendungsfall
Korrelationsanalyse der Kundenzufriedenheit

Ein Telekommunikationsunternehmen möchte verstehen, welche Faktoren die Kundenzufriedenheit am stärksten beeinflussen. Das Marketing-Team analysiert die Beziehung zwischen dem m...

Anwendungsfall
Hochvolumige Sensor-Validierung in der Fertigung

Eine Smart-Factory sammelt Daten von Tausenden von Sensoren an verschiedenen Maschinentypen. Um prädiktive Wartungsmodelle zu validieren, müssen Ingenieure die Korrelation zwisc...

Anwendungsfall
Risikomodellierung mit fehlenden Werten und Gewichtung

Eine Bank entwickelt ein neues Kreditrisikomodell basierend auf Umfragedaten zur finanziellen Stabilität. Die Daten sind unvollständig (Nullwerte) und einige Beobachtungen haben...