图像相似度中的Hash算法

  • 时间:
  • 浏览:6
  • 来源:幸运快3_快3直播_幸运快3直播

本博客中使用的代码见本文末尾

       度量两张图片的类似于于度有或多或少算法,本文讲介绍工程领域中最常用的图片类似于于度算法之一——Hash算法。Hash算法准确的说有这人,分别为平均哈希算法(aHash)、感知哈希算法你(pHash)和差异哈哈希算法(dHash)。

       这人Hash算法都有通过获取图片的hash值,再比较两张图片hash值的汉明距离(韩明距离的概念可见本公众号《》一文)来度量两张图片算是类似于于。两张图片越类似于于,越来越两张图片的hash数的汉明距离越小。下面本文将分别介绍这这人Hash算法。

1.1 算法步骤

       平均哈希算法是这人Hash算法中最简单的这人,它通过下面多少步骤来获得图片的Hash值,这多少步骤分别是(1) 缩放图片;(2)转灰度图; (3) 算像素均值;(4)根据类似于于均值计算指纹。具体算法如下所示:

表1 aHash得到图片Hash值地算法
缩放图片 输入图片大小尺寸各异,为了统一图片的输入,统一将图片尺寸缩放为8*8,一共得到了6有一另另俩个像素点。
转灰度图 输入图片或多或少为单通道灰度图,或多或少RGB三通道彩色图,或多或少为RGBA四通道彩色图。也为了统一下一步输入标准,将非单通道图片都转为单通道灰度图。 其中RGB三通道转单通道算法有下面几种:

1.浮点算法:Gray=R0.3+G0.59+B0.11

2.整数依据:Gray=(R
500+G59+B11)/5000

3.移位依据:Gray =(R76+G151+B*28)>>8;

4.平均值法:Gray=(R+G+B)/3;

5.仅取绿色:Gray=G;
算像素均值 通过上一步可得有一另另俩个8x8的整数矩阵G,计算或多或少矩阵中所有元素的平均值,假设其值为a
据像素均值计算指纹 初始化输入图片的ahash = ""

从左到右一行一行地遍历矩阵G每有一另另俩个像素肯能第i行j列元素G(i,j) >= a,则ahash += "1"肯能第i行j列元素G(i,j) <a, 则ahash += "0"

       得到图片的ahash值后,比较两张图片ahash值的汉明距离,通常认为汉明距离小于10的一组图片为类似于于图片。

1.2 具体实例

       本文图片为Lena图来说明.



图1 Lena(Origin)图


图2 转为8x8尺寸的Lena图


图3 转为灰度8x8尺寸的Lena图

       其中转为8x8尺寸的Lena对应的数据矩阵为:



       很容得到如上矩阵所有元素的均值a= 121.328125, 将上述矩阵中大于或等于a的元素置为1, 小于a的元素置为0,可得:



       很多可得Lena图的aHash为

       10111110500011110500011101101050001101010111050000500000015000001050000

       将二进制形式ahash转十六进制hash为

       be9e9da9aba500e2c

       为了测试aHash算法的效果,当当我门 用一张带噪声Lena(noise)图和与Lena不一样的Barbara做图片类似于于度对比实验,其中Lena(noise)和Barbara如下:



图4 Lena(noise)图


图5 Barbara图

       通过aHash算法容易得有一另另俩个图片的hash值,后后根据hanming距离计算Lena(origin).png和Lena(noise).png Barbar.png之间汉明距离,具体如下:



图6 aHash算法图片类似于于度实验

       由上图可见aHash能区别类似于于图片和差异大的图片。

2.1 算法步骤

       感知哈希算法是这人Hash算法中较为多样化的这人,它是基于DCT(离散余弦变换)来得到图片的hash值,其算法多少步骤分别是(1) 缩放图片;(2)转灰度图; (3) 计算DCT;(4)缩小DCT; (5)算平均值;(6) 计算指纹。具体算法如下所示:

表2 pHash得到图片Hash值地算法
缩放图片 统一将图片尺寸缩放为32*32,一共得到了102有一另另俩个像素点。
转灰度图 统一下一步输入标准,将非单通道图片都转为单通道灰度图。
计算DCT 计算32x32数据矩阵的离散余弦变换后对应的32x32数据矩阵
缩小DCT 取上一步得到32x32数据矩阵左上角8x8子区域
算平均值 通过上一步可得有一另另俩个8x8的整数矩阵G, 计算或多或少矩阵中所有元素的平均值,假设其值为a
计算指纹 初始化输入图片的phash = ""

从左到右一行一行地遍历矩阵G每有一另另俩个像素

肯能第i行j列元素G(i,j) >= a,则phash += "1"

肯能第i行j列元素G(i,j) <a, 则phash += "0"

       得到图片的phash值后,比较两张图片phash值的汉明距离,通常认为汉明距离小于10的一组图片为类似于于图片。

2.2 具体实例

       仍用Lena图来说明.



图7 转为灰度32x32尺寸的Lena图


图8 灰度32x32尺寸Lena图对应的DCT矩阵

       通过计算可得灰度32x32Lenna图对应的DCT矩阵左上角8x8区域子矩阵为:



       很容得到如上矩阵所有元素的均值a= 77.35, 将上述矩阵中大于或等于a的元素置为1, 小于a的元素置为0,可得:



       很多可得Lena图的pHash为

       50005000015000005000010105000005000101050000000005000015000000010500000000

       将二进制形式phash转十六进制hash为

       99c454255002382500

       为了测试pHash算法的效果,同样用一张带噪声Lena(noise)图和与Lena不一样的Barbara做图片类似于于度对比实验。通过pHash算法容易得有一另另俩个图片的hash值,后后根据hanming距离计算Lena(origin).png和Lena(noise).png Barbar.png之间汉明距离,具体如下:



图9 pHash算法图片类似于于度实验

       由上图可见pHash能区别类似于于图片和差异大的图片。

3.1 算法步骤

       相比pHash,dHash的带宽单位要快的多,相比aHash,dHash在带宽单位几乎相同的状况下的效果要更好,它是基于渐变实现的。其算法多少步骤分别是(1) 缩放图片;(2)转灰度图; (3) 计算DCT;

(4)缩小DCT; (5)算平均值;(6) 计算指纹。具体算法如下所示:

表3 dHash得到图片Hash值地算法
小图片 统一将图片尺寸缩放为9x8,一共得到了7有一另另俩个像素点
转灰度图 统一下一步输入标准,将非单通道图片都转为单通道灰度图。
算差异值 当前行像素值-前一行像素值, 从第二到第九行共8行,又肯能矩阵有8列,很多得到有一另另俩个8x8差分矩阵G
算平均值 通过上一步可得有一另另俩个8x8的整数矩阵G, 计算或多或少矩阵中所有元素的平均值,假设其值为a
计算指纹 初始化输入图片的dhash = ""

从左到右一行一行地遍历矩阵G每有一另另俩个像素

肯能第i行j列元素G(i,j) >= a,则dhash += "1"

肯能第i行j列元素G(i,j) <a, 则dhash += "0"

       得到图片的phash值后,比较两张图片phash值的汉明距离,通常认为汉明距离小于10的一组图片为类似于于图片。

3.2 具体实例

       仍用Lena图来说明.



图7 转为灰度9x8尺寸的Lena图

       通过计算可得灰度9x8Lenna图数据矩阵为:



       从第二行刚结束进行减去前一行操作,可得如下查分矩阵



       将上述矩阵中大于或等于0元素置为1, 小于a的元素置为0,可得:



       很多可得Lena图的dHash为

       01050000000110111111050000010500050001101011101011500000105000010500000

       将二进制形式dhash转十六进制hash为

       99c454255002382500

       为了测试dHash算法的效果,同样用一张带噪声Lena(noise)图和与Lena不一样的Barbara做图片类似于于度对比实验。通过pHash算法容易得有一另另俩个图片的hash值,后后根据hanming距离计算Lena(origin).png和Lena(noise).png Barbar.png之间汉明距离,具体如下:



图9 dHash算法图片类似于于度实验

       由上图可见dHash能区别类似于于图片和差异大的图片。

       关于图像类似于于度算法除了Hash算法,在传统算法领域中还有基于SIFT的匹配算法,基于Gist特性的匹配算法;在深度学习领域中有 基于ResNet全连接的匹配算法。感兴趣的读者还都可否通过google来了解哪多少算法。

参考资料

432-Looks-Like-It

529-Kind-of-Like-That

本文代码

Github代码