simple correlation

Korrelationsanalyse der Kundenzufriedenheit

Scénario de test & Cas d'usage

Geschäftskontext

Ein Telekommunikationsunternehmen möchte verstehen, welche Faktoren die Kundenzufriedenheit am stärksten beeinflussen. Das Marketing-Team analysiert die Beziehung zwischen dem monatlichen Datenverbrauch (in GB), der Anrufdauer (in Minuten) und dem in Umfragen ermittelten Zufriedenheitswert (Skala 1-10), um Churn-Treiber zu identifizieren.
Datenaufbereitung

Erstellung eines Datensatzes mit Kundennutzungsdaten und Zufriedenheitswerten.

Kopiert!
1DATA casuser.customer_metrics;
2 INPUT cust_id data_usage_gb call_minutes satisfaction_score;
3 DATALINES;
41 15.5 120 8
52 2.0 45 4
63 50.0 300 9
74 0.5 10 3
85 25.0 180 7
96 10.0 90 6
107 5.0 60 5
118 100.0 500 10
12;
13RUN;

Étapes de réalisation

1
Ausführung der Korrelation mit deskriptiven Statistiken und Kovarianzmatrix.
Kopiert!
1PROC CAS;
2 SIMPLE.correlation /
3 TABLE={name='customer_metrics'}
4 inputs={{name='data_usage_gb'}, {name='call_minutes'}, {name='satisfaction_score'}}
5 descriptiveStats=true
6 covariance=true
7 pearsonOut={name='corr_output', replace=true};
8RUN;
2
Überprüfung der Ergebnisse.
Kopiert!
1 
2PROC CAS;
3TABLE.fetch TABLE={name='corr_output'};
4RUN;
5 

Erwartetes Ergebnis


Das System berechnet die Pearson-Korrelationen, zeigt die Kovarianzmatrix an und liefert Mittelwerte/Standardabweichungen für die Nutzungsvariablen. Es wird eine starke positive Korrelation zwischen `data_usage_gb` und `satisfaction_score` erwartet.