sequence

cspade

Beschreibung

Die Aktion cspade führt Sequenz-Mining unter Verwendung des cSpade-Algorithmus durch. Sie identifiziert häufige Sequenzen von Ereignissen in Transaktionsdaten unter Berücksichtigung von Zeitbeschränkungen.

Einstellungen
ParameterBeschreibung
table Gibt die Eingabetabelle an, die die Eingabesequenzen für die Analyse enthält.
casout Gibt die Ausgabetabelle an, welche die häufigen Sequenzen und deren Supportwerte enthält.
sequenceId Gibt die Variable an, die die Sequenz oder den Kunden identifiziert (z. B. Kunden-ID).
eventId Gibt die Variable an, die den Zeitpunkt oder das Ereignis definiert (z. B. Transaktionszeit).
itemId Gibt die Variable an, die das Element oder den Artikel enthält (z. B. Produkt-ID).
minGap Gibt die minimale Zeitdifferenz zwischen aufeinanderfolgenden Elementen einer Sequenz an (Standard: 1).
maxGap Gibt die maximale Zeitdifferenz zwischen aufeinanderfolgenden Elementen einer Sequenz an.
maxLen Gibt die maximale Anzahl von Elementen (Länge) einer Sequenz an (Standard: 10).
maxSize Gibt die maximale Anzahl von Artikeln innerhalb eines Elements einer Sequenz an (Standard: 10).
support Gibt das minimale Unterstützungsniveau (Support) für eine Sequenz an (Wertebereich 0-1).
supportCnt Gibt die minimale Anzahl von Transaktionen an, die für eine Sequenz auftreten müssen.
Erstellung von Transaktionsdaten für Sequenz-Mining

Erstellt eine Beispieltabelle mit Kunden-IDs, Zeitpunkten und Artikeln und lädt sie in die CAS-Sitzung.

Kopiert!
1 
2DATA casuser.transactions;
3INPUT cid time item $;
4DATALINES;
51 10 A 1 15 B 1 20 A 1 25 C 2 15 A 2 20 C 2 25 B 2 30 A 3 10 B 3 25 A 4 10 A 4 20 B 4 25 C ;
6 
7RUN;
8 

Beispiele

Führt den cSpade-Algorithmus aus, um häufige Sequenzen basierend auf Kunden-ID, Zeit und Artikel zu finden.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3sequence.cspade / TABLE={name="transactions"} sequenceId="cid" eventId="time" itemId="item" casout={name="seq_out", replace=true};
4 
5RUN;
6 
Ergebnis :
Erzeugt die Tabelle 'seq_out' mit den identifizierten häufigen Sequenzen und deren Support.

Führt die Analyse mit Einschränkungen für minimalen Support, maximale Sequenzlänge und Zeitabstände durch.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3sequence.cspade / TABLE={name="transactions"} sequenceId="cid" eventId="time" itemId="item" support=0.3 maxLen=5 minGap=2 maxGap=20 casout={name="seq_detailed", replace=true};
4 
5RUN;
6 
Ergebnis :
Erzeugt die Tabelle 'seq_detailed', die nur Sequenzen enthält, die einen Support von mindestens 30% haben, maximal 5 Elemente lang sind und Zeitabstände zwischen 2 und 20 Einheiten aufweisen.

FAQ

Was ist der Hauptzweck der cspade-Aktion?
Welche Parameter sind für die Ausführung der cspade-Aktion zwingend erforderlich?
Was steuert der Parameter "support"?
Wozu dienen die Parameter "minGap" und "maxGap"?
Welche Funktion hat der Parameter "casout"?
Was bestimmt der Parameter "maxLen"?

Zugehörige Szenarien

Anwendungsfall
Standard-Warenkorbanalyse im E-Commerce

Ein Online-Einzelhändler möchte Kaufmuster identifizieren, um Produktempfehlungen zu verbessern. Das Ziel ist es, häufige Abfolgen von Produktkäufen (z. B. 'Schuhe' gefolgt von ...

Anwendungsfall
Analyse von Web-Clickstreams mit Zeitbeschränkungen

Ein Medienportal analysiert Navigationspfade. Es ist wichtig zu filtern, wie schnell Benutzer zwischen Seiten wechseln. Wir suchen nach Sequenzen, bei denen der nächste Klick ni...

Anwendungsfall
Analyse klinischer Pfade mit Längenbeschränkung

Ein Krankenhaus untersucht Behandlungsabfolgen für eine seltene Krankheit. Da die Daten spärlich sind, verwenden wir eine absolute Anzahl (supportCnt) statt Prozentwerten. Zudem...