在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常使用余弦相似度来表示。余弦相似度的取值为【-1,1】,相同的两个向量之间的相似度为1,如果希望得到类似于距离的标识,讲1减去余弦相似度即为余弦距离。因此余弦距离的取值范围为【0,2】,相同的两个向量余弦距离为0

相关知识点:余弦相似度、余弦距离、欧式距离、距离的定义

余弦定理:

        描述三角形中三条边长度与一个角的余弦关系的数学定理

余弦定义公式:

图1 三角形

余弦定义表达式1

    

      

        

 勾股定理是余弦定理的特例,当r为90°时cos(r)=0,余弦定理可简化为

 ,即勾股定理

 余弦定义表达式2:

      

余弦定义表达式3(角元形式):

余弦相似度

定义

余弦相似度,又称余弦相似性 ,是通过计算两个向量角度的余弦值来评估他们的相似度

两个向量之间的角度 

0度角余弦值为1,其他任何角度的余弦值均不大于1,并且最小的余弦值为-1

两个向量角度的余弦值,确定两个向量是否大致指向相同的方向

        两个向量有相同的指向时,余弦相似度的值为1

        两个向量夹角为90度时,余弦相似度的值为0

        两个向量指向完全相反的方向时,余弦相似度的值为-1

这个结果与向量的长度是无关的,仅仅与向量的指向方向相关

余弦相似度通常用于正空间,因此给出的值为0到1之间,通常用于文本挖掘中的文件比较

公式:

欧式距离

定义:欧几里得度量,也称欧氏距离,指在n为空间中两个点之间的真实举例,或向量的自然长度,也就是该点到原点的距离。

在二维和三维控件的欧氏距离就是两点之间的实际距离

公式:

二维空间公式:

其中:

为点与点之间的欧式距离;为点到原点的欧氏距离

三维空间公式:

n维空间公式:

欧式距离与预先距离的区别:

在单位圆上,余弦距离和欧式距离的范围都是【0,2】,我们已知欧式距离是一个合法的距离,二余弦距离与欧式距离有二次关系,

为 

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐