提示:
文章目录
- 给定两个特征向量,以下哪些方法可以计算这两个向量相似度??
- @[TOC](文章目录)
- 题目
- 二、解题
- 用图片信息熵量化图片并比较
- 欧式距离
- 曼哈顿距离
- 余弦距离
- 汉明距离
- 总结
给定两个特征向量,以下哪些方法可以计算这两个向量相似度?
欧式距离
夹角余弦(Cosine)
信息熵
曼哈顿距离
二、解题
普通信息熵不行,要是相对熵就可以
用图片信息熵量化图片并比较图像熵表示为图像灰度级集合的比特平均数,单位比特/像素,也描述了图像信源的平均信息量。
对于离散形式的二维图像,其信息熵的计算公式为:
对于上式,其中,pi 为每一灰度级出现的概率。
熵指的是体系的混乱的程度,对焦良好的图像的熵大于没有清晰对焦的图像,因此可以用熵作为一种对焦评价标准。熵越大,图像越清晰。
图像的熵是一种**特征的统计形式,**它反映了图像中平均信息量的多少,表示图像灰度分布的聚集特征,却不能反映图像灰度分布的空间特征,为了表征这种空间特征,可以在一维熵的基础上引入能够反映灰度分布空间特征的特征量来组成图像的二维熵。
统计出图片中每个灰度出现的概率,然后用熵公式,计算出图片信息熵。
两个图片的熵越接近,说明其越相似。
如果整个图片求1个信息熵值,会出现与全局直方图同样的问题,即对像素重新排列,熵不变。
因此借鉴局部直方图法,将图片分块后,对每一块求熵比较,最后统计。
欧式距离也称为欧几里得距离或者欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。在二维和三维空间中的欧式距离就是两点之间的距离。
曼哈顿距离也称为出租车几何,用来标明两个点在标准坐标系上的绝对坐标轴距离和。
在图2中,假设从B1到达C3,则曼哈顿距离可以表示为x=(3−2)+(3−1)=3
欧式距离与曼哈顿距离的比较
下面我们通过一张经典的示例来说明两者的区别。
(为了方便说明,我们假设左下角的起点为A,右上角的终点为B)
从图中可以看出,绿色的线表示为欧式距离,而红色的 线为曼哈顿距离,
其他的蓝色的线和黄色的线都可以表示为曼哈顿距离的变形。
余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。
在信息论中,两个等长字符串之间的汉明距离(英语:Hamming distance)是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。
例如:
1011101与1001001之间的汉明距离是2。
2143896与2233796之间的汉明距离是3。
"toned"与"roses"之间的汉明距离是3。
总结
提示:重要经验:
1)两个图片的熵越接近,说明其越相似。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。