如何选择分类分析算法?
文本分类:朴素贝叶斯,例如电子邮件中垃圾邮件的识别。训练集较小,选择高偏差且低方差的分类算法:朴素贝叶斯、支持向量机(不容易过拟合)算法模型的计算时间短和模型易用性,不要选支持向量机、人工神经网络重视算法的准确率:支持向量机或GBDT、XGBoost等基于Boosting的集成方法注重效果的稳定性或模型鲁棒性,那么应选择随机森林、组合投票模型等基于Bagging的集成方法。想得到有关预测结果的概率
·
-
文本分类:朴素贝叶斯,例如电子邮件中垃圾邮件的识别。
-
训练集较小,选择高偏差且低方差的分类算法:朴素贝叶斯、支持向量机(不容易过拟合)
-
算法模型的计算时间短和模型易用性,不要选支持向量机、人工神经网络
-
重视算法的准确率:支持向量机或GBDT、XGBoost等基于Boosting的集成方法
-
注重效果的稳定性或模型鲁棒性,那么应选择随机森林、组合投票模型等基于Bagging的集成方法。
-
想得到有关预测结果的概率信息,基于预测概率做进一步的应用:逻辑回归
-
担心离群点或数据不可分并且需要清晰的决策规则:决策树。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)