dataSciencePilot analyzeMissingPatterns

Analyse fehlender Kundendaten zur Optimierung von Marketingkampagnen

Scénario de test & Cas d'usage

Geschäftskontext

Ein Marketingteam möchte verstehen, warum einige Kundenprofile unvollständig sind (z. B. fehlendes Alter, Einkommen). Sie vermuten, dass diese Muster fehlender Daten mit der Reaktion des Kunden auf eine frühere Kampagne (Zielvariable 'hat_gekauft') korrelieren könnten. Dies wird ihnen helfen zu entscheiden, ob sie eine Datenvervollständigungskampagne durchführen oder zukünftige Marketingmaßnahmen anpassen sollen.
Über das Set : dataSciencePilot

Automatisiertes maschinelles Lernen (AutoML) und Pipeline-Generierung.

Entdecken Sie alle Aktionen von dataSciencePilot
Datenaufbereitung

Erstellung einer Kundentabelle mit absichtlich fehlenden demografischen Informationen und einer Kaufverhaltens-Zielvariable.

Kopiert!
1DATA mycas.KUNDEN_PROFILE;
2 ATTRIB KundenID LENGTH=8 Alter LENGTH=8 Jahreseinkommen LENGTH=8 Region $10 hat_gekauft LENGTH=8;
3 INPUT KundenID Alter Jahreseinkommen Region $ hat_gekauft;
4 DATALINES;
5101 34 65000 Nord 1
6102 . 82000 Sued 0
7103 45 . Nord 1
8104 28 54000 West 0
9105 . . Ost 0
10106 51 95000 Sued 1
11107 39 . West 1
12108 42 71000 Ost 0
13109 . 88000 Nord 0
14110 60 110000 . 1
15;
16RUN;

Étapes de réalisation

1
Laden der Kundendaten in eine CAS-Tabelle (bereits im Data-Prep-Schritt erfolgt).
Kopiert!
1/* Daten bereits in mycas.KUNDEN_PROFILE geladen */
2
Ausführung der Analyse fehlender Muster mit 'hat_gekauft' als Zielvariable, um Korrelationen zwischen fehlenden Daten und dem Kaufverhalten zu identifizieren.
Kopiert!
1PROC CAS;
2 dataSciencePilot.analyzeMissingPatterns
3 TABLE={name='KUNDEN_PROFILE', caslib='mycas'},
4 inputs={'Alter', 'Jahreseinkommen', 'Region'},
5 target='hat_gekauft',
6 casOut={name='marketing_missing_patterns', caslib='mycas', replace=true};
7RUN;
8QUIT;

Erwartetes Ergebnis


Die Ausgabetabelle 'marketing_missing_patterns' soll die verschiedenen Muster fehlender Werte auflisten (z.B. 'nur Alter fehlt', 'Alter und Einkommen fehlen'). Für jedes Muster soll die Verteilung der Zielvariable 'hat_gekauft' angezeigt werden. Es wird erwartet, dass das Muster, bei dem sowohl Alter als auch Einkommen fehlen, eine signifikant niedrigere Kaufquote aufweist, was dem Marketingteam eine Grundlage für gezielte Datenanreicherungsinitiativen liefert.