定义
使用多尺度组合分组(Multiscale Combinatorial Grouping)和自底向上的分割方法。
这篇文章是物体检测方面的工作。输入一张图像,输出图像中各个物体的边缘轮廓。这个方法使用了多尺度的组合分割策略,通过二叉树聚类物体边缘,将组合结果使用分类器训练得到最好的分割效果。
对于输入图像,首先生成一张边缘图。这张图也就是原始图像的超像素聚类结果,也就是一个个不同的区域,任意两个相邻的区域之间都有一个不相似度值。所以这个边缘图其实表示的是一种概率。这个概率值越小,这两个区域越有可能合并为一个区域。
在边缘图里,黑色区域部分可以认为是connected regions,该图通过白色部分分离开来,白色部分的每个像素都是一个实值(0-1),图中每条边的一小段的像素值都是相同的,该值表示该边所连接区域的不相似度,值越小,这两个区域越有可能合并称为一个区域。利用边缘图获取图像的超像素,任意两个相邻的超像素之间都有一个不相似度值。
接下来需要对这些区域进行分层次的合并。这些初始的区域作为叶子节点两两合并,最终得到整幅图像,构成一棵完全二叉树。初始的超像素区域和组合后的非叶子节点都可以看成原始图像的一种分割可能性。收集这些可能的结果,筛选出与标准结果重叠度大于95%的组合结果,得到一个完整的分割可能性集合。之后提取每个候选组合的面积、周长、边界强度等2D基本特征,用这些特征组成向量来表示该组合,然后训练随机森林回归器来对这些组合排名。
参考文献
[1] Bertinetto L, Valmadre J, Golodetz S, et al. Staple: Complementary learners for real-time tracking[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 1401-1409.