数据可视化之关联分析
关联分析是数据挖掘中一项基础又重要的技术,是一种在大型数据库中发现变量之间有趣关系的方法。例如在市场销售方面的应用,很多用户购买产品A的同时,也连带购买了产品B,根据这个结果调整货架的布局陈列、设计促销组合方案,实现销量的提升,说起这个,很多人都会首先想到沃尔玛超市发现购买尿布的顾客通常也会购买啤酒,于是把啤酒和尿布放在一起销售同时提高了两者的销量的案例。这是关联分析在商业领域应用的一个典型,通过
关联分析是数据挖掘中一项基础又重要的技术,是一种在大型数据库中发现变量之间有趣关系的方法。
例如在市场销售方面的应用,很多用户购买产品A的同时,也连带购买了产品B,根据这个结果调整货架的布局陈列、设计促销组合方案,实现销量的提升,说起这个,很多人都会首先想到沃尔玛超市发现购买尿布的顾客通常也会购买啤酒,于是把啤酒和尿布放在一起销售同时提高了两者的销量的案例。这是关联分析在商业领域应用的一个典型,通过对大量商品记录作分析,提取出能够反映顾客偏好的有用的规则。
关联数据分析不但在商业领域被广泛应用,在医疗、教育和金融领域等也得到了有效的应用。接下来小编用一组化妆品销售的数据,带大家来了解关联分析的使用。
支持度与置信度说明
支持度:以商品来说明这个概念的话,支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例,用图表示就是两者之间的交集。
置信度:置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率,用图表示就是交集在A中的比例。
提升度:提升度是先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,换句话说,就是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。
可以看到最小支持度数值是0.3,最小置信度为0.6。关联分析表格中隔离乳与精华乳的支持度为0.3,通过分析这项数据可以得出,购买隔离乳的用户再次购买精华乳的概率较小。
然后看隔离乳与精华水这个例子,包含{隔离乳}项的内容出现了4次,包含{隔离乳与精华水}项的内容也出现了4 次,那么这个它的置信度就是1。说明每次购买隔离乳的用户同时也会购买精华水。
从最终得到的结果我们能够看出来不同商品之间的类别关系,下面简单总结几条结论:
购买隔离乳化妆品的用户,同时购买精华水的概率较高,我们可以在将隔离乳和精华水放在一起销售,或者将隔离乳和精华水组成一个套餐进行销售。
购买爽肤水化妆品的用户,同时购买精华水的概率较低,我们可以将这两款产品放置在不同的区域进行销售,同时在各个区域放置其他产品来提高销售量。
当然还有很多其他结论,可以帮助我们对商品的销售进行分析和处理(如下图的公司销售情况大屏),或者帮助我们做出对企业或者其他领域的一些有利决策,帮助我们提高销量,拉大增长率等,实现数据的价值。

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)