Scénario de test & Cas d'usage
Automatisiertes maschinelles Lernen (AutoML) und Pipeline-Generierung.
Entdecken Sie alle Aktionen von dataSciencePilotErstellung einer Kundentabelle mit absichtlich fehlenden demografischen Informationen und einer Kaufverhaltens-Zielvariable.
| 1 | DATA mycas.KUNDEN_PROFILE; |
| 2 | ATTRIB KundenID LENGTH=8 Alter LENGTH=8 Jahreseinkommen LENGTH=8 Region $10 hat_gekauft LENGTH=8; |
| 3 | INPUT KundenID Alter Jahreseinkommen Region $ hat_gekauft; |
| 4 | DATALINES; |
| 5 | 101 34 65000 Nord 1 |
| 6 | 102 . 82000 Sued 0 |
| 7 | 103 45 . Nord 1 |
| 8 | 104 28 54000 West 0 |
| 9 | 105 . . Ost 0 |
| 10 | 106 51 95000 Sued 1 |
| 11 | 107 39 . West 1 |
| 12 | 108 42 71000 Ost 0 |
| 13 | 109 . 88000 Nord 0 |
| 14 | 110 60 110000 . 1 |
| 15 | ; |
| 16 | RUN; |
| 1 | /* Daten bereits in mycas.KUNDEN_PROFILE geladen */ |
| 1 | PROC CAS; |
| 2 | dataSciencePilot.analyzeMissingPatterns |
| 3 | TABLE={name='KUNDEN_PROFILE', caslib='mycas'}, |
| 4 | inputs={'Alter', 'Jahreseinkommen', 'Region'}, |
| 5 | target='hat_gekauft', |
| 6 | casOut={name='marketing_missing_patterns', caslib='mycas', replace=true}; |
| 7 | RUN; |
| 8 | QUIT; |
Die Ausgabetabelle 'marketing_missing_patterns' soll die verschiedenen Muster fehlender Werte auflisten (z.B. 'nur Alter fehlt', 'Alter und Einkommen fehlen'). Für jedes Muster soll die Verteilung der Zielvariable 'hat_gekauft' angezeigt werden. Es wird erwartet, dass das Muster, bei dem sowohl Alter als auch Einkommen fehlen, eine signifikant niedrigere Kaufquote aufweist, was dem Marketingteam eine Grundlage für gezielte Datenanreicherungsinitiativen liefert.