算法设计原则验证实验报告_ID3决策树算法的训练与测试
我是通信与信息系统专业,但是研一下选了《机器学习》课程。课程有一个作业,是ID3决策树算法的训练与测试,但是网上的代码要不就是用Python写的,要不就是只有训练没有测试部分代码。好不容易在网上找到一份既有训练又有测试的代码,稍加修改,却耗费了几周时间。中途有好几次都不想调这个代码了,想了想,还是继续试一试吧。课程结束后,我将自己对这个代码的理解录制成了视频,放到B站上面,希望对学习ID3算法的同
我是通信与信息系统专业,但是研一下选了《机器学习》课程。课程有一个作业,是ID3决策树算法的训练与测试,但是网上的代码要不就是用Python写的,要不就是只有训练没有测试部分代码。
好不容易在网上找到一份既有训练又有测试的代码,稍加修改,却耗费了几周时间。中途有好几次都不想调这个代码了,想了想,还是继续试一试吧。
课程结束后,我将自己对这个代码的理解录制成了视频,放到B站上面,希望对学习ID3算法的同学有帮助,想不到真的有小伙伴们看呢。
于是,我将发在B站的视频,也发在这里。视频中,ID3决策树训练和测试完整代码下载链接是:123kevin456/ID3-MATLAB
欢迎你双击屏幕、点赞、收藏、转发和分享,关注我的知乎号,一起学习,共同进步。
知乎视频www.zhihu.com后面连着,附上ID3算法实验报告
一、实验目的
给定UCI的DNA数据集,使用ID3算法用训练数据集生成决策树,再使用该决策树对测试数据集进行分类,比较决策树的判决输出结果与测试数据集期待的判决结果,统计分类的正确个数并计算正确率。
考虑到选择不同的delta值时对采用信息熵增益和信息熵增益率时的分类正确率有影响。
由于并不知道分类正确率随delta变化的关系,因此在本次实验中选择delta为0.001,0.01,0.05,0.1,,0.15,0.2时进行实验,正确率随着delta值变化如图4.2:
结合图中的趋势,得出以下结论:
(1)当delta为0.1,采用信息熵增益最大原则挑选最佳属性时,得到分类正确率为0.908094435075885;
(2)当delta为0.05,采用信息熵增益率最大原则挑选最佳属性时,得到分类正确率为0.910623946037100。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)