机器学习在竞赛和工业界应用区别
机器学习在竞赛和工业界应用是有很大区别的,竞赛通常关注极致的评价指标,而工业应用会在满足应用标准的前提下,会更加关注模型的稳定性、可解释性和领域专家知识的应用
·
机器学习在竞赛和工业界应用是有很大区别的,竞赛通常关注极致的评价指标,而工业应用会在满足应用标准的前提下,会更加关注模型的稳定性、可解释性和领域专家知识的应用
竞赛
通常为了取的比赛名次,极致地通过各种方法提升评价指标
- 数据质量:数据源不变,不关注数据质量提升
- 模型应用:使用新模型、复杂模型、模型融合的方法
- 特征工程:使用计算代价很高的数据增强
- 调参:进行大量的模型调参工作
- 稳定性:离线模型,对稳定性要求低
- 领域专家知识:很多竞赛甚至会对原始数据进行脱敏(如字段名称重新标记),防止专家知识的运用,因此竞赛中的领域专家知识运用较少
工业应用
通常在满足应用场景的条件下,更加关注模型的稳定性,注重数据质量的不断提升
- 数据质量:数据是不断变化的,因此关注数据质量提升
- 模型应用:一般使用主流、相对简单的模型,较少使用复杂模型、模型融合的方法,这对于模型的可解释性以及问题debug会有帮助
- 特征工程:关注工程性能,一般不会使用计算代价很高的数据增强
- 调参:超参数固定后,较长时间不动(一般一年调几次)
- 稳定性:生产环境线上实时模型部署,对稳定性要求高
- 领域专家知识:会运用专家知识、理论模型进行建模
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)