La acción `fism` aplica el algoritmo FP-growth (Frequent Pattern growth) para identificar conjuntos de elementos frecuentes (frequent item sets) en datos transaccionales. Es esencial para el análisis de la cesta de la compra y la minería de reglas de asociación, permitiendo descubrir qué artículos tienden a aparecer juntos en las transacciones con una frecuencia superior a un umbral definido (soporte).
| Parámetro | Descripción |
|---|---|
| table | Especifica la tabla de entrada (objeto castable) que contiene los datos transaccionales a analizar. |
| idVariable | Especifica la variable que agrupa los datos en transacciones o cestas (ej. ID de Ticket o ID de Cliente). |
| tgtVariable | Especifica la variable nominal objetivo que contiene los elementos o artículos (ej. Producto). |
| suppct | Especifica el nivel mínimo de soporte como porcentaje del total de transacciones. Los conjuntos de ítems deben aparecer en este porcentaje de transacciones para ser considerados frecuentes. |
| supmin | Especifica el recuento mínimo absoluto de soporte. Anula el parámetro `suppct` si se utiliza. |
| items | Define el número de elementos a incluir en una regla o conjunto. El valor predeterminado es 2 cuando se especifica una tabla de salida. |
| nFis_Range | Especifica el rango (mínimo y máximo) del número de elementos permitidos en los conjuntos de ítems frecuentes generados. |
| out | Especifica la tabla de salida (casouttable) que contendrá los conjuntos de ítems frecuentes encontrados, junto con sus conteos y soporte. |
| outFreq | Especifica la tabla de salida (casouttable) que contendrá los elementos frecuentes únicos con sus conteos de transacciones y soporte. |
Creamos una tabla CAS con transacciones de compras simuladas, donde cada transacción contiene múltiples productos.
| 1 | DATA mycas.market_basket; INPUT id_transaccion producto $; DATALINES; |
| 2 | 1 Manzana |
| 3 | 1 Leche |
| 4 | 1 Pan |
| 5 | 2 Manzana |
| 6 | 2 Pan |
| 7 | 3 Leche |
| 8 | 3 Pan |
| 9 | 3 Huevos |
| 10 | 4 Manzana |
| 11 | 4 Leche |
| 12 | 4 Pan |
| 13 | 4 Huevos |
| 14 | 5 Pan |
| 15 | 5 Huevos |
| 16 | ; RUN; |
Ejecuta el algoritmo FP-growth para encontrar combinaciones de productos que aparecen en al menos el 40% de las transacciones.
| 1 | |
| 2 | PROC CAS; |
| 3 | ruleMining.fism / TABLE={name="market_basket", caslib="casuser"} idVariable="id_transaccion" tgtVariable="producto" suppct=40 out={name="sets_frecuentes", caslib="casuser"}; |
| 4 | |
| 5 | RUN; |
| 6 |
Busca conjuntos frecuentes que contengan entre 1 y 3 artículos, utilizando un conteo mínimo de 2 transacciones (en lugar de porcentaje), y genera tanto la tabla de conjuntos como la de frecuencias de ítems únicos.
| 1 | |
| 2 | PROC CAS; |
| 3 | ruleMining.fism / TABLE={name="market_basket", caslib="casuser"} idVariable="id_transaccion" tgtVariable="producto" supmin=2 items=3 nFis_Range={lower=1, upper=3} out={name="sets_detallados", caslib="casuser", replace=true} outFreq={name="frecuencia_items", caslib="casuser", replace=true}; |
| 4 | |
| 5 | RUN; |
| 6 |