多尺度特征

2020-12-28 17:25:11 浏览:628

多尺度特征在计算机视觉领域具有重要意义。以DPM为代表的经典方法及以卷积神经网络为主的深度学习方法,均涉及到多尺度特征的设计与应用,且表现出了优异的性能。

传统方法中的多尺度特征以HOG特征为例进行说明。HOG特征,又名方向梯度直方图(Histogram of Oriented Gradient, HOG),是一种在计算机视觉和图像处理中用来进行物体检测的特征。与其他特征提取的方法相比,HOG特征的核心思想在于局部目标的形状和外观能够用梯度或边缘的方向密度进性描述,是一种对图像的局部操作,对图像几何形变和光照变化具有较好的稳定性。

HOG特征步骤如下:

1、图像预处理。伽马矫正(减少光度影响)和图像灰度化(HOG特征提取纹理信息)
2、计算图像像素点梯度值,得到梯度图(尺寸和原图同等大小)
3、将图像划分多个cell,统计cell内梯度直方图
4、将2×2个cell联合成一个block,对每个block做块内梯度归一化

图 1 结合 SVM的HOG特征计算流程图[2]。(a)训练样本上的平均梯度图像。(b)每个像素在以像素为中心的块中显示最大正值SVM权值。(c)支持向量机负权值也是如此。(d)测试图像。(e)测试图像对应的 R-HOG描述符。(f,g) R-HOG描述符分别由正、负SVM权值加权。

深度学习方法中的多尺度特征则以特征金字塔网络为例进行说明。特征金字塔网络Feature Pyramid Networks(FPN),首次出现在由Tsung-Yi Lin、何恺明等人在 CVPR 2017 发表的论文中。该网络结构利用深卷积网络固有的多尺度金字塔结构来构造具有边际额外成本的特征金字塔。提出了一种具有横向连接的自顶向下结构,用于构建各种尺度的高级语义特征图。这种架构被称为特征金字塔网络(FPN),作为一种通用的特征提取器,它在一些应用中得到了显著的改进。

图 2 特征金字塔的四种构造方式。(a)图像金字塔建立特征金字塔。特征是在每个图像尺度上独立计算的,速度慢。(b)只使用单一比例尺的特征来加快计算速度。(c)使用由卷积网络计算出的金字塔特征层次结构 (d)特征金字塔网络(FPN)与(b)和(c)一样快,但更准确。在该图中,特征图由蓝色轮廓表示,较粗的轮廓表示语义上较强的特征。

多尺度的信息在目标检测、物体识别与分割等众多领域具有重要价值,多尺度模型的设计一直是被众多研究人员关注的问题。除了多尺度特征之外,多尺度输入、多尺度特征融合等策略也能够事变多尺度信息提取的目的。

参考文献

[1] https://senitco.github.io/2017/06/10/image-feature-hog/
[2] Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]//2005 IEEE computer society conference on computer vision and pattern recognition (CVPR'05). IEEE, 2005, 1: 886-893.
[3] Lin, Tsung-Yi, Piotr Dollár, Ross B. Girshick, Kaiming He, Bharath Hariharan and Serge J. Belongie. “Feature Pyramid Networks for Object Detection.” 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (2017): 936-944.

神经网络

作          者: 泮桥成像光电商城

出          处: https://www.ipanqiao.com/entry/91

版          权:本文版权归泮桥成像光电商城所有

免责声明:本文中使用的部分文字内容与图片来自于网络,如有侵权,请联系作者进行删除。

转          载:欢迎转载,但必须保留上述声明;必须在文章中给出原文链接;否则必究法律责任。

Copyright © 2019-2022 南京超维景生物科技有限公司 版权所有 www.ipanqiao.com苏ICP备20009590号-1
联系我们
立即做合同
微信客服
电话咨询

400-998-9826

17302548620

快速留言

泮桥成像光电商城专业人员会在24小时之内联系您

关闭 提交