Skip to content

采用Apriori算法,Fpgrowth算法,Eclat算法对超市商品数据集进行频繁集与关联规则的挖掘

License

Notifications You must be signed in to change notification settings

ZbWeR/Association-rule-mining

Repository files navigation

💡项目介绍

对频繁集、关联规则的相关概念和方法进行了归纳整理,并采用python 3.9.7Matlab 2020b设计实现了常见的关联规则算法Apriori算法,FpGrowth算法,Eclat算法.

📝目录结构描述

.
│  README.pdf					//即此文档
│  关联规则算法研究及其应用.pdf	//暑期实训论文pdf格式
│  思维导图.png					 //思维导图png格式
│  
└─实验程序与数据
    ├─源代码					  //项目源代码
    │  ├─Matlab代码			  //Matlab实现
    │  │      apriori.m
    │  │      ECLAT.m
    │  │      
    │  └─python代码			   //python实现
    │          Apriori.py
    │          Eclat.py
    │          FpGrowth.py
    │          pre.py			//数据预处理
    │          
    └─超市关联规则数据集
            apriori.xlsx		//存放apriori挖掘的关联规则
            dataset.xlsx		//存放处理后的数据,在Sheet3
            Eclat.xlsx			//存放Eclat挖掘的关联规则
            fpgrowth.xlsx		//存放Fpgrowth挖掘的关联规则
            Original data.xlsx	//存放原始数据集
            效率对比具体数据.xlsx  //存放三种算法在相同条件下运行时间

📖使用说明

算法原理阐述见关联规则算法研究及其应用.pdf

至于源代码下的算法文件,按照下文所述修改参数,直接运行即可.读入数据存放在dataset.xlsx,输出数据存放在对应的Excel文件下。

  • Apriori.py:修改第6行的path为[超市关联数据集]的目录,修改第120,121行的最小支持度和最小置信度参数.函数load_data_set作用为加载数据,测试新的数据时请在此函数更改.第124到134行为数据输出,输出格式为:关联规则左侧+关联规则右侧+置信度+支持度,详情可见apriori.xlsx

  • Eclat.py:第136行修改相关参数,修改第138行的path,第141到153行为加载数据.输出数据格式同上

  • FpGrowth.py:第210行修改相关参数,修改第212行的path,第215到第227行为加载数据.输出格式同上

  • apriori.mECLAT.m:只需修改第6行的目录地址即可

About

采用Apriori算法,Fpgrowth算法,Eclat算法对超市商品数据集进行频繁集与关联规则的挖掘

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy