定义
是一种集合相似度度量函数,通常用于计算两个样本的相似度[1]。
Dice系数的定义:
s的取值范围为0到1之间。
Dice系数和雅卡尔指数的异同
Dice系数和雅卡尔指数都可以用于对相似性的度量,二者取值范围均为0到1之间,但其不具备三角不等性的性质。
应用场景
Dice参数目前已在计算机词典学中变得很流行,用于测量两个给定单词的词汇联想得分[2]。它也常用于图像分割,特别是用于比较算法输出与金标准的对比。
参考文献
[1] Rychlý P. A lexicographer-friendly association score[C]//RASLAN. 2008: 6-9.
[2] Bray J R, Curtis J T. An ordination of the upland forest communities of southern Wisconsin[J]. Ecological monographs, 1957, 27(4): 326-349.
参阅:雅卡尔指数 (Jaccard index)