在matlab中使用k-means无监督学习对鸢尾花数据集进行分类

本次实验采用了使用一定先验知识对数据集初始化，将第一类鸢尾花中的数据作为第一个聚类中心的初始化，二、三类同理。对此现象，我认为是k-means算法不能从全局对数据分类导致分类结果差，事实上，数据本身是成功且较为有效的完成了聚类，k-means算法作为无监督学习具有先天的局限性，先前数据的错误分类将导致后续数据的错误处理，鸢尾花数据集的数据之间分界并不足够明显，这也是导致数据分类效果差的原因。后续又

铭....

850人浏览 · 2023-04-06 20:26:46

铭.... · 2023-04-06 20:26:46 发布

本次实验采用了使用一定先验知识对数据集初始化，将第一类鸢尾花中的数据作为第一个聚类中心的初始化，二、三类同理。分类完成后，将第一类聚类中包含的第一类鸢尾花数据数目、第二类聚类中包含的第二类鸢尾花数据数目，第三类聚类中包含的第三类鸢尾花数据数目相加并除以总数，作为k-means分类算法的正确率，分类结果如下：
在这里插入图片描述可以看到，这个分类的正确率并不高，于是我不断尝试，发现正确率一直在40%上下波动，于是我绘制散点图来对结果进行分析：

在这里插入图片描述
我将三类绘制成不同颜色的散点图，在这个视角下其实并不算清晰，于是我旋转视角，绘制了这张：

对此现象，我认为是k-means算法不能从全局对数据分类导致分类结果差，事实上，数据本身是成功且较为有效的完成了聚类，k-means算法作为无监督学习具有先天的局限性，先前数据的错误分类将导致后续数据的错误处理，鸢尾花数据集的数据之间分界并不足够明显，这也是导致数据分类效果差的原因。
后续又采用了数据归一化的办法对数据进行预处理，效果依然不理想，原因依然如上。
对于上述结果，后续本人将采用Isodata算法继续进行尝试

代码下载链接如下：https://download.csdn.net/download/weixin_46538207/87659685

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。