多示例学习

2021-04-22 14:03:54 浏览:1132

多示例学习的概念最早由Dietterich等人在1997年[1]提出,用于解决训练数据不清晰的问题:一个样本(包)可由多个特征向量(示例)表示,然而多个向量中只存在一个影响该样本标签的特征向量,但具体是哪一个并不知道,即仅知道样本的标签并不知道多个特征向量对样本标签的贡献。

一个典型的例子便是药物活性预测问题,大多数药物是小分子,通过与更大的靶分子结合而发生作用。药物的性能取决于其与靶分子结合的程度,而结合程度很大程度上依赖于药物分子的形状:同一化学表达式的药物分子有多种形状,但因为同分异构体的存在只有一种是决定药物活性的。药物预测的目的在于:对于一种已知化学分子的药物分子,预测具有活性的分子形状。抽象为多示例学习,一个样本即为一种药物分子,该分子的多种形状代表该样本的多个特征向量。

图1 四种麝香分子[1]

由于只有一种分子形状决定药物活性,因此多实例学习中存在一个基本假设:一个阳性包中至少存在一个阳性示例,一个阴性包中所有示例均为阴性。该假设建立了包中示例标签与包标签之间的联系。与传统的监督学习不同,多示例问题中只存在包级别的标签,示例标签是缺失的。在基本假设的前提下,每次选择包中最有可能的一个示例进行训练,不断迭代更新直到分类函数能够识别不同类样的包为止。

图 2 监督学习与多示例学习的对比[2]

参考文献

[1] Cohen T, Welling M. Group equivariant convolutional networks[C]//International conference on machine learning. 2016: 2990-2999.
[2] http://cedric.cnam.fr/~thomen/talks/Talk_DeepImaging_PRISMES.pdf

作          者: 泮桥成像光电商城

出          处: https://www.ipanqiao.com/entry/668

版          权:本文版权归泮桥成像光电商城所有

免责声明:本文中使用的部分文字内容与图片来自于网络,如有侵权,请联系作者进行删除。

转          载:欢迎转载,但必须保留上述声明;必须在文章中给出原文链接;否则必究法律责任。

Copyright © 2019-2022 南京超维景生物科技有限公司 版权所有 www.ipanqiao.com苏ICP备20009590号-1
联系我们
立即做合同
微信客服
电话咨询

400-998-9826

17302548620

快速留言

泮桥成像光电商城专业人员会在24小时之内联系您

关闭 提交