ruleMining

fism

Beschreibung

Die Aktion fism (Frequent Item Set Mining) wendet den FP-Growth-Algorithmus an, um häufige Itemsets in Transaktionsdaten zu identifizieren. Sie ist ein wesentlicher Bestandteil der Assoziationsanalyse (z. B. Warenkorbanalyse) und berechnet die Häufigkeit (Support) von Kombinationen von Items. Die Aktion ermöglicht die Steuerung der Analyse durch Parameter für minimalen Support und die Größe der Itemsets.

Einstellungen
ParameterBeschreibung
idVariableGibt die Variable an, die die Transaktionen (Warenkörbe) gruppiert (z. B. Kunden-ID oder Transaktionsnummer).
tgtVariableGibt die Zielvariable an, die die Items enthält (z. B. Produktname).
tableDie Eingabetabelle, die die zu analysierenden Transaktionsdaten enthält.
supminGibt den minimalen Support als absolute Anzahl von Transaktionen an. Ein Itemset muss mindestens so oft vorkommen, um berücksichtigt zu werden.
suppctGibt den minimalen Support als Prozentsatz der Gesamttransaktionen an (Wertebereich 0-100).
nFis_RangeDefiniert einen Bereich (lower/upper) für die Anzahl der Items in einem häufigen Itemset (z. B. Sets mit 1 bis 3 Produkten).
outGibt die Ausgabetabelle an, die die gefundenen häufigen Itemsets inklusive Transaktionsanzahl und Support enthält.
outFreqGibt eine Ausgabetabelle an, die die eindeutigen häufigen Items mit ihren Zählungen enthält.
itemsGibt die Anzahl der Items in einer Regel an (Standard ist 2).
Erstellung von Transaktionsdaten

Erzeugt eine Tabelle mit Transaktionen, wobei 'TID' die Transaktions-ID und 'Item' das Produkt darstellt.

Kopiert!
1 
2DATA mycas.market_data;
3LENGTH TID $8 Item $20;
4INPUT TID $ Item $;
5DATALINES;
6101 Milk 101 Bread 101 Eggs 102 Milk 102 Bread 103 Milk 103 Eggs 104 Bread 104 Eggs 105 Milk 105 Bread 105 Eggs 105 Beer;
7 
8RUN;
9 

Beispiele

Findet Itemsets, die in mindestens 2 Transaktionen vorkommen, basierend auf der Transaktions-ID.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3ruleMining.fism / TABLE={name="market_data", caslib="casuser"} idVariable="TID" tgtVariable="Item" supmin=2 out={name="fism_sets", caslib="casuser", replace=true};
4 
5RUN;
6 
Ergebnis :
Eine Tabelle 'fism_sets', die alle Itemsets auflistet, die den minimalen Support von 2 erfüllen.

Führt die Analyse durch, beschränkt die Itemsets auf eine Größe von 1 bis 3 Elementen und speichert zusätzlich die Frequenzen der einzelnen Items.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3ruleMining.fism / TABLE={name="market_data", caslib="casuser"} idVariable="TID" tgtVariable="Item" supmin=2 nFis_Range={lower=1, upper=3} out={name="fism_sets_det", caslib="casuser", replace=true} outFreq={name="fism_freq_det", caslib="casuser", replace=true};
4 
5RUN;
6 
Ergebnis :
Die Tabelle 'fism_sets_det' enthält häufige Itemsets der Länge 1 bis 3. Die Tabelle 'fism_freq_det' enthält die Häufigkeitszählung für jedes einzelne Item.

FAQ

Was ist der Hauptzweck der Aktion fism?
Welche Parameter sind für die Ausführung der fism-Aktion zwingend erforderlich?
Was bewirkt der Parameter supmin?
Wie unterscheidet sich der Parameter suppct von supmin?
Welche Informationen werden in der Ausgabetabelle outFreq gespeichert?
Wie kann die Anzahl der Items in einem Set gesteuert werden?