定义
在机器学习领域和统计分类问题中,混淆矩阵(英语:confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。其每一列代表预测值,每一行代表的是实际的类别。这个名字来源于它可以非常容易的表明多个类别是否有混淆(比如说把一个类的样本错误的预测成了另一类)。
举例
假设有20个样本,其中实际包含A类样本8个,B类样本10个,C类样本2个,后经预测模型预测得到对应20个样本的预测类别,对应混淆矩阵如下所示:
由表可知,8个实际为A类的样本预测结果均为A类,B类样本8个预测正确,2个被预测为C类,C类样本2个全部被预测为C类。此表可以清晰显示预测结果的正确率及错误预测结果,错误的预测结果分布在对角线位置之外。