Die Aktion cspade führt Sequenz-Mining unter Verwendung des cSpade-Algorithmus durch. Sie identifiziert häufige Sequenzen von Ereignissen in Transaktionsdaten unter Berücksichtigung von Zeitbeschränkungen.
| Parameter | Beschreibung |
|---|---|
| table | Gibt die Eingabetabelle an, die die Eingabesequenzen für die Analyse enthält. |
| casout | Gibt die Ausgabetabelle an, welche die häufigen Sequenzen und deren Supportwerte enthält. |
| sequenceId | Gibt die Variable an, die die Sequenz oder den Kunden identifiziert (z. B. Kunden-ID). |
| eventId | Gibt die Variable an, die den Zeitpunkt oder das Ereignis definiert (z. B. Transaktionszeit). |
| itemId | Gibt die Variable an, die das Element oder den Artikel enthält (z. B. Produkt-ID). |
| minGap | Gibt die minimale Zeitdifferenz zwischen aufeinanderfolgenden Elementen einer Sequenz an (Standard: 1). |
| maxGap | Gibt die maximale Zeitdifferenz zwischen aufeinanderfolgenden Elementen einer Sequenz an. |
| maxLen | Gibt die maximale Anzahl von Elementen (Länge) einer Sequenz an (Standard: 10). |
| maxSize | Gibt die maximale Anzahl von Artikeln innerhalb eines Elements einer Sequenz an (Standard: 10). |
| support | Gibt das minimale Unterstützungsniveau (Support) für eine Sequenz an (Wertebereich 0-1). |
| supportCnt | Gibt die minimale Anzahl von Transaktionen an, die für eine Sequenz auftreten müssen. |
Erstellt eine Beispieltabelle mit Kunden-IDs, Zeitpunkten und Artikeln und lädt sie in die CAS-Sitzung.
| 1 | |
| 2 | DATA casuser.transactions; |
| 3 | INPUT cid time item $; |
| 4 | DATALINES; |
| 5 | 1 10 A 1 15 B 1 20 A 1 25 C 2 15 A 2 20 C 2 25 B 2 30 A 3 10 B 3 25 A 4 10 A 4 20 B 4 25 C ; |
| 6 | |
| 7 | RUN; |
| 8 |
Führt den cSpade-Algorithmus aus, um häufige Sequenzen basierend auf Kunden-ID, Zeit und Artikel zu finden.
| 1 | |
| 2 | PROC CAS; |
| 3 | sequence.cspade / TABLE={name="transactions"} sequenceId="cid" eventId="time" itemId="item" casout={name="seq_out", replace=true}; |
| 4 | |
| 5 | RUN; |
| 6 |
Führt die Analyse mit Einschränkungen für minimalen Support, maximale Sequenzlänge und Zeitabstände durch.
| 1 | |
| 2 | PROC CAS; |
| 3 | sequence.cspade / TABLE={name="transactions"} sequenceId="cid" eventId="time" itemId="item" support=0.3 maxLen=5 minGap=2 maxGap=20 casout={name="seq_detailed", replace=true}; |
| 4 | |
| 5 | RUN; |
| 6 |
Ein Online-Einzelhändler möchte Kaufmuster identifizieren, um Produktempfehlungen zu verbessern. Das Ziel ist es, häufige Abfolgen von Produktkäufen (z. B. 'Schuhe' gefolgt von ...
Ein Medienportal analysiert Navigationspfade. Es ist wichtig zu filtern, wie schnell Benutzer zwischen Seiten wechseln. Wir suchen nach Sequenzen, bei denen der nächste Klick ni...
Ein Krankenhaus untersucht Behandlungsabfolgen für eine seltene Krankheit. Da die Daten spärlich sind, verwenden wir eine absolute Anzahl (supportCnt) statt Prozentwerten. Zudem...