当阳性样本信息不完整时,召回率和精确率置信区间的计算方法
背景: 已知一个二分类预测模型和一个用于预测的样本集合 \(\mathbb{S}\),将模型预测结果为阳性的子集记为 \(\mathbb{A}\)。为评价该模型的预测能力,至少需要计算出它在这个样本集 \(\mathbb{S}\) 上的召回率 ...
背景: 已知一个二分类预测模型和一个用于预测的样本集合 \(\mathbb{S}\),将模型预测结果为阳性的子集记为 \(\mathbb{A}\)。为评价该模型的预测能力,至少需要计算出它在这个样本集 \(\mathbb{S}\) 上的召回率 ...

一、定义 1.1 样本与结果的分类 如下图所示,以阴阳(Negative青,Positive黄)标记样本实际类别(如:阴阳、正负、男女、是否、有无……),以真假(True,False斜线阴影)描述预测结果是否正确,因此可将样本分为4类,简记为: 真阳(TP):样本为阳,预测为阳(黄绿色); 假阴(FN):样本为阳,预测为阴(黄绿色+斜线); 真阴(TN):样本为阴,预测为阴(青绿色); 假阳(FP):样本为阴,预测为阳(青绿色+斜线)。