临床病理学专家通过在显微镜下观察染色标本载玻片来进行病理诊断。近年来,人们尝试用扫描仪捕捉整个幻灯片,并将其保存为数字图像(全幻灯片图像,WSI)。随着大量WSIs的积累,人们尝试使用基于机器学习算法的数字图像分析来分析WSIs,以辅助包括诊断在内的任务。数字病理图像分析常用一般的图像识别技术(如人脸识别)作为基础。然而,由于数字病理图像和任务有一些独特的特点,往往需要特殊的处理技术。
数字病理影像主要存在以下几个特点:
- 内存占比高。一张典型的数字病理影像多具有上亿像素点,对计算机内存提出了很高的要求。
- 分辨率高。自然图像分析中多采用亚采样的方式降低图像内存占比,但这种操作会影像图像的分辨率,而病理影像作为临床诊断的金标准,对分辨率有着很高的要求。分辨率的降低可能对临床医生诊断造成一定的影响。
- 标注难度大。高质量的病理影像标注,对医生的时间和专业提出了很高的要求。
数字组织病理学图像识别是一个非常适合机器学习的问题,因为图像本身包含足够的诊断信息。如何有效地借鉴自然图像分析中的方法在减少病理影像标注的同时保证分析性能,是值得不断关注的问题。
参考文献
[1] Komura D, Ishikawa S. Machine learning methods for histopathological image analysis[J]. Computational and structural biotechnology journal, 2018, 16: 34-42.
[2] Tennakoon R, Bortsova G, Ørting S, et al. Classification of Volumetric Images Using Multi-Instance Learning and Extreme Value Theorem[J]. IEEE Transactions on Medical Imaging, 2019.