Apriori关联规则算法实现——python（anaconda）

导入需要的包import pandas as pdimport numpy as np读取csv文件path = r"D:\postgraduate\study\data_mining\test\guanxinbing.csv"data_datafram = pd.read_csv(path,encoding="gbk")由于读取到的数据是datafram，所以先将pandas读取的数据转化为ar

梦里1米8

2631人浏览 · 2021-10-19 20:40:26

梦里1米8 · 2021-10-19 20:40:26 发布

导入需要的包

import pandas as pd
import numpy as np

读取csv文件
在这里插入图片描述

path = r"D:\postgraduate\study\data_mining\test\guanxinbing.csv"
data_datafram = pd.read_csv(path,encoding="gbk")

由于读取到的数据是datafram，所以先将pandas读取的数据转化为array

data_array = np.array(data_datafram)

然后转化为list形式

data_list =data_array.tolist()

获取列名（表头）

name = data_datafram.columns.values

按照0,1对应为列名

medicine = []
for i in range(356):
    num = data_list[i]
    case = zip(name,num)
    temp_list = []
    for j in case:
        if j[1] == 1.0:
            temp_list.append(j[0])
    medicine.append(temp_list)

导入包，进行关联规则分析

from efficient_apriori import apriori
transactions = medicine
itemsets,rules = apriori(transactions,
                         min_support = 0.1,
                         min_confidence= 0.7)
print(itemsets,'\n')
for i in rules:
    print(i)

使用 pip install pip install efficient_apriori 安装pip install efficient_apriori

输出结果为在这里插入图片描述
补充：

csv文件是一种用逗号和换行区分数据记录和字段的文件结构，
可以用excel表格编辑，也可以用记事本编辑，是一种类似于excel的数据存储文件。
pandas提供了pd.read_csv()方法可以读取其中的数据并且转换成DataFrame的数据类型。

DataFrame是一种表格型数据结构
它含有一组有序的列，每列可以是不同的值类型(数值、字符串、布尔型等)，DataFrame既有行索引（index）也有列索引（column）。
DataFrame可以根据dict进行创建，或通过读取csv或者txt文件来创建。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。