KNN算法机器学习入门算法流程总结

机器学习【KNN】（入门必备）KNN的全称是K Nearest Neighbors。顾名思义，k个最接近的邻居。可以用于分类，也可以用于回归。如上图所示。中心点为测试数据，其他五边形和五角星为训练数据。k=3，测试数据属于五边形；k=5，测试数据属于五角星。距离公式欧式距离d(x,y)=(x1−y1)2+(x2−y2)2+⋅⋅⋅+(xn−yn)2=∑i=1n(xi−yi)2(2.1) d(x, y

CV_William

638人浏览 · 2020-07-05 18:22:52

CV_William · 2020-07-05 18:22:52 发布

机器学习【KNN】（入门必备）

KNN的全称是K Nearest Neighbors。顾名思义，k个最接近的邻居。可以用于分类，也可以用于回归。

在这里插入图片描述如上图所示。中心点为测试数据，其他五边形和五角星为训练数据。k=3，测试数据属于五边形；k=5，测试数据属于五角星。

距离公式

欧式距离

$\sqrt[]{(x_1 - y_1)^2 + (x_2 - y_2)^2 + ··· + (x_n - y_n)^2} = \sqrt[]{\sum_{i=1} ^ n {(x_i - y_i)} ^ 2}$

曼哈顿距离
$|x_1 - y_1| + |x_2 - y_2| + ··· + |x_n - y_n| = \sum_{i=1} ^ n {|x_i - y_i|}$

KNN分类

新来一个点，统计这个点周围距离最近k个点的类别标签，就可以推断出这个点属于哪个类别。

算法原理

* 新来一条测试数据，计算该数据与n训练数据之间的距离。
* 将得到的n个距离值排序。
* 取距离最小的k条数据。
* 计算k条数据所在类别的频数。
* 最后返回k条数据出现频数最高的类别，即为测试数据的类别。

KNN回归

新来一个点，取这个点周围距离最近k个点的均值，然后去预测这个点的值。

算法原理

* 新来一条测试数据，计算该数据与n条训练数据之间的距离。
* 将得到的n个距离值排序。
* 取距离最小的k条数据的值，求均值。
* 返回均值做为测试数据的预测值。

欢迎大家交流学习，任何问题都可以留言

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

「极限压缩量化未来」Modelers GeekDay上海站圆满落幕

魔乐社区

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

所有评论(0)

查看更多评论

CV_William

@weixin_41194171

已为社区贡献7条内容

KNN算法 机器学习入门算法 流程总结

CV_William

机器学习【KNN】（入门必备）

欢迎大家交流学习，任何问题都可以留言

所有评论(0)

温馨提示：您尚未绑定手机号

CV_William

KNN算法机器学习入门算法流程总结