定义
meanshift是一种非参数特征空间分析技术[1],用于定位密度函数的最大值,也就是所谓的模态搜索算法,可用于聚类、图像分割、跟踪等。算法通过将数据点向模式移动来迭代地将数据点分配给聚类。因此,它也被称为模式搜索算法。均值漂移算法在图像处理和计算机视觉领域有着广泛的应用。
Yizong Cheng等人对基本的算法做了以下的推广,首先定义了一族核函数,使得随着样本与被偏移点的距离不同,其偏移量对均值偏移向量的贡献也不同,其次设定了一个权重系数,使得不同的样本点重要性不一样,这大大扩大了Mean shift的适用范围。
meanshift用于目标跟踪常见首选在当前帧选择参考模型,在模型的邻域中搜索下一帧通过最大化相似度函数找到最优的候选框。
图 1 目标跟踪的步骤
图 2 meanshift原理
图(a),所有的点与圆心为起点形成的向量相加的结果就是meanshift;图(b),在下一次迭代过程中算出当前点的偏移均值,将该点移动到此偏移均值,然后以此为新的起始点,继续移动,直到满足最终的条件;图(c)(d)中不断迭加,元素移动到它邻域中所有元素的特征值的均值的位置,不断重复直到收敛。
参考文献
[1] Fukunaga, Keinosuke, and Larry Hostetler. "The estimation of the gradient of a density function, with applications in pattern recognition." IEEE Transactions on information theory 21.1 (1975): 32-40.
[2] Cheng, Yizong. "Mean shift, mode seeking, and clustering." IEEE transactions on pattern analysis and machine intelligence 17.8 (1995): 790-799.