bart bartScore

Analyse der Vorhersageunsicherheit bei einer großen Kundendatenbank

Scénario de test & Cas d'usage

Geschäftskontext

Ein Telekommunikationsunternehmen möchte die Abwanderungswahrscheinlichkeit für seine gesamte Kundenbasis (mehrere Millionen Kunden) vorhersagen. Für Kunden mit hohem Wert ist das Marketingteam nicht nur an der durchschnittlichen Vorhersage interessiert, sondern auch an der Unsicherheit der Vorhersage. Dies erfordert die Analyse der Ergebnisse aus jeder einzelnen MCMC-Stichprobe des BART-Modells.
Über das Set : bart

Bayesianische additive Regressionsbäume.

Entdecken Sie alle Aktionen von bart
Datenaufbereitung

Erstellt eine große Tabelle (100.000 Zeilen), die eine große Kundendatenbank simuliert. Enthält Merkmale wie Vertragslaufzeit, monatliche Kosten und genutzte Dienste.

Kopiert!
1DATA mycas.kunden_daten_gross;
2 call streaminit(456);
3 DO KundenNr = 1 to 100000;
4 Vertragslaufzeit_Monate = 1 + floor(rand('UNIFORM') * 72);
5 MonatlicheKosten = 20 + rand('UNIFORM') * 100;
6 Anzahl_Dienste = 1 + floor(rand('UNIFORM') * 5);
7 OUTPUT;
8 END;
9RUN;

Étapes de réalisation

1
Annahme: Ein trainiertes Abwanderungsmodell 'churn_modell_bart' existiert in mycas. Die große Kundentabelle wird geladen.
Kopiert!
1 
2PROC CASUTIL;
3load
4DATA=mycas.kunden_daten_gross casout='kunden_daten_gross' replace;
5RUN;
6 
2
Führt bart.bartScore mit avgOnly=FALSE aus, um Vorhersagen aus allen MCMC-Stichproben zu erhalten. Berechnet auch 99%-Kredibilitätsintervalle.
Kopiert!
1PROC CAS;
2 bart.bartScore /
3 restore={name='churn_modell_bart', caslib='mycas'},
4 TABLE={name='kunden_daten_gross', caslib='mycas'},
5 avgOnly=FALSE,
6 alpha=0.01,
7 lcl='Kredibilitätsgrenze_Unten_99',
8 ucl='Kredibilitätsgrenze_Oben_99',
9 copyVars={'KundenNr'},
10 casOut={name='kunden_churn_details', caslib='mycas', replace=true};
11RUN;
3
Überprüft die Spalten der Ausgabetabelle, um sicherzustellen, dass die einzelnen MCMC-Stichproben-Spalten (z.B. _S_1, _S_2, ...) erstellt wurden.
Kopiert!
1 
2PROC CAS;
3TABLE.columnInfo / TABLE={name='kunden_churn_details', caslib='mycas'};
4RUN;
5 

Erwartetes Ergebnis


Die Aktion verarbeitet die große Datenmenge erfolgreich. Die Ausgabetabelle 'mycas.kunden_churn_details' ist signifikant breiter als die Eingabetabelle. Sie enthält die 'KundenNr', die durchschnittliche Vorhersage, die 99%-Kredibilitätsgrenzen und eine große Anzahl zusätzlicher Spalten, die die Vorhersage aus jeder einzelnen MCMC-Stichprobe darstellen. Dies bestätigt die Fähigkeit der Aktion, detaillierte und volumengroße Scoring-Aufgaben zu bewältigen.