sequence

cspade

Beschreibung

Die Aktion cspade führt Sequenz-Mining unter Verwendung des cSpade-Algorithmus durch. Sie identifiziert häufige Sequenzen von Ereignissen in Transaktionsdaten unter Berücksichtigung von Zeitbeschränkungen.

Einstellungen
ParameterBeschreibung
tableGibt die Eingabetabelle an, die die Eingabesequenzen für die Analyse enthält.
casoutGibt die Ausgabetabelle an, welche die häufigen Sequenzen und deren Supportwerte enthält.
sequenceIdGibt die Variable an, die die Sequenz oder den Kunden identifiziert (z. B. Kunden-ID).
eventIdGibt die Variable an, die den Zeitpunkt oder das Ereignis definiert (z. B. Transaktionszeit).
itemIdGibt die Variable an, die das Element oder den Artikel enthält (z. B. Produkt-ID).
minGapGibt die minimale Zeitdifferenz zwischen aufeinanderfolgenden Elementen einer Sequenz an (Standard: 1).
maxGapGibt die maximale Zeitdifferenz zwischen aufeinanderfolgenden Elementen einer Sequenz an.
maxLenGibt die maximale Anzahl von Elementen (Länge) einer Sequenz an (Standard: 10).
maxSizeGibt die maximale Anzahl von Artikeln innerhalb eines Elements einer Sequenz an (Standard: 10).
supportGibt das minimale Unterstützungsniveau (Support) für eine Sequenz an (Wertebereich 0-1).
supportCntGibt die minimale Anzahl von Transaktionen an, die für eine Sequenz auftreten müssen.
Erstellung von Transaktionsdaten für Sequenz-Mining

Erstellt eine Beispieltabelle mit Kunden-IDs, Zeitpunkten und Artikeln und lädt sie in die CAS-Sitzung.

Kopiert!
1 
2DATA casuser.transactions;
3INPUT cid time item $;
4DATALINES;
51 10 A 1 15 B 1 20 A 1 25 C 2 15 A 2 20 C 2 25 B 2 30 A 3 10 B 3 25 A 4 10 A 4 20 B 4 25 C ;
6 
7RUN;
8 

Beispiele

Führt den cSpade-Algorithmus aus, um häufige Sequenzen basierend auf Kunden-ID, Zeit und Artikel zu finden.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3sequence.cspade / TABLE={name="transactions"} sequenceId="cid" eventId="time" itemId="item" casout={name="seq_out", replace=true};
4 
5RUN;
6 
Ergebnis :
Erzeugt die Tabelle 'seq_out' mit den identifizierten häufigen Sequenzen und deren Support.

Führt die Analyse mit Einschränkungen für minimalen Support, maximale Sequenzlänge und Zeitabstände durch.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3sequence.cspade / TABLE={name="transactions"} sequenceId="cid" eventId="time" itemId="item" support=0.3 maxLen=5 minGap=2 maxGap=20 casout={name="seq_detailed", replace=true};
4 
5RUN;
6 
Ergebnis :
Erzeugt die Tabelle 'seq_detailed', die nur Sequenzen enthält, die einen Support von mindestens 30% haben, maximal 5 Elemente lang sind und Zeitabstände zwischen 2 und 20 Einheiten aufweisen.

FAQ

Was ist der Hauptzweck der cspade-Aktion?
Welche Parameter sind für die Ausführung der cspade-Aktion zwingend erforderlich?
Was steuert der Parameter "support"?
Wozu dienen die Parameter "minGap" und "maxGap"?
Welche Funktion hat der Parameter "casout"?
Was bestimmt der Parameter "maxLen"?

Zugehörige Szenarien

Anwendungsfall
Standard-Warenkorbanalyse im E-Commerce

Ein Online-Einzelhändler möchte Kaufmuster identifizieren, um Produktempfehlungen zu verbessern. Das Ziel ist es, häufige Abfolgen von Produktkäufen (z. B. 'Schuhe' gefolgt von ...

Anwendungsfall
Analyse von Web-Clickstreams mit Zeitbeschränkungen

Ein Medienportal analysiert Navigationspfade. Es ist wichtig zu filtern, wie schnell Benutzer zwischen Seiten wechseln. Wir suchen nach Sequenzen, bei denen der nächste Klick ni...

Anwendungsfall
Analyse klinischer Pfade mit Längenbeschränkung

Ein Krankenhaus untersucht Behandlungsabfolgen für eine seltene Krankheit. Da die Daten spärlich sind, verwenden wir eine absolute Anzahl (supportCnt) statt Prozentwerten. Zudem...