关联规则

关联规则(Association Rules)反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物预测到。关联规则分析是数据挖掘中最活跃的研究方法之一,其中一个典型例子是购物篮(Market Basket)分析。通过发现顾客购物篮中的不同商品之间的联系,分析顾客的购买习惯,了解哪些商品频繁地被顾客同时购买,以帮助零售商制定营销策略。那么,对于超市,我们可以优化产品的位置摆放,价目表设计、商品促销等,对于电商,我们可以优化商品所在的仓库位置,达到节约成本,增加经济效益的目的。
  • 应用案例:
    1、  “67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。    2、  某网上书店向用户推荐相关书籍。    3、  “《C语言》课程优秀的同学,在学习《数据结构》时为优秀的可能性达88%”,那么就可以通过强化《C语言》的学习来提高教学效果。    4、  在保险业务方面,如果出现了不常见的索赔要求组合,则可能为欺诈,需要作进一步的调查;    5、  在医疗方面,可找出可能的治疗组合;    6、  在银行方面,对顾客进行分析,可以推荐感兴趣的服务等等。
  • 常用的关联规则算法如下表所示:

算法名称

算法描述

Apriori

关联规则最常用也是最经典的挖掘频繁项集的算法,其核心思想是通过连接产生候选项集,再经过剪枝、支持度的比较生成频繁项集。

FP-Tree

针对Apriori算法的多次扫描事务数据集的缺陷,导致时间复杂度大,提出了不产生候选项集的方法FP-Tree(也称FP-Growth算法)。

Eclat算法

Eclat算法是一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间划分为较小的子空间。

ab775a745c80a190c132e9a74148cf38.png

f0607e4be06b7d422944a0f8f86ebbe6.png

61ec79cd4a7474ed82c312a101535a9d.png

fc28dc53b933f0834896bf4b8357212b.png

4220da82d486df7f33b19aef63b56efd.png

Apriori算法

a2a87429bb7a0d4437b41c1cd471426e.png

560bb7ea0270ae94b120d593b0191811.png

4b50a228c2fcd5cd0b312a3f3454f507.png

3d27425053d311bac194ba858a01d6fb.png

2489c47e4aa5650751eaed193fa31d06.png

例子

318d4aee4154f44c94cacbd6f9211a96.png

06a0f23e5b7c792fbd9314ebfac704e9.png

7fba6cbef88e1c6734346f2c5f052ec4.png

8c5fb609548bb45bc004c3d520c236df.png

c7fc59617088ea498bfb4790239d85ae.png

Apriori算法总结

e1930302ccfc2bf5ecba17393bba3458.png

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐