京公网安备 11010802034615号
经营许可证编号:京B2-20210330
理论物理学家和研究科学家Mehmet Suzen曾表示,二分类任务是机器学习的基础。但是,其性能的标准统计信息是一种数学工具,ROC-AUC很难解释。在这里,引入了一种性能度量,该度量仅考虑进行正确的二进制分类的可能性。
机器学习模型的核心应用是二分类任务。从用于诊断测试的医学领域到为消费者提供信用风险决策的领域,有很多领域。建立分类器的技术多种多样,从简单的决策树到逻辑回归,再到最近利用多层神经网络的超酷深度学习模型。但是,它们在构造和训练方法上在数学上有所不同,就其评估而言,事情变得棘手。在本文中,我们为实践中的二元分类器提出了一种简单且可解释的性能指标。
为什么ROC-AUC无法解释?
因为不同的阈值会产生不同的混淆矩阵。
报告分类器性能的实际标准是使用接收机工作特性(ROC)-曲线下面积(AUC)''度量。它起源于1940年代美国海军研发雷达时,用于测量探测性能。 ROC-AUC的含义至少有5种不同的定义,即使您拥有博士学位也是如此。在机器学习中,人们很难解释AUC作为绩效指标的含义。由于AUC功能几乎在所有图书馆中都可用,并且它几乎像一种宗教仪式一样,在机器学习论文中作为分类表现进行报告。但是,除了荒谬的比较问题之外,其解释并不容易,请参阅hmeasure。 AUC会根据从不同阈值的混淆矩阵中提取的假正率(FPR)来衡量真正率(TPR)曲线下的面积。
f(x)= y
∫10 f(x)dx = AUC
其中,y是TPR,x是FPR。除了多种解释且容易混淆之外,将积分放在FPR之上没有明确的目的。显然,我们希望通过将FPR设置为零来实现完美的分类,但是该区域在数学上并不清晰,这意味着它作为一个数学对象是不清楚的。
正确分类的概率(PCC)
对于二分类问题的分类器而言,一种简单且可解释的性能指标对于技术含量高的数据科学家和非技术利益相关者都非常有用。这个方向的基本租户是,分类器技术的目的是区分两个类别的能力。这归结为一个概率值,正确分类的概率(PCC)。一个明显的选择是所谓的平衡精度(BA)。通常建议将其用于不平衡问题,即使是SAS也是如此;尽管他们使用了概率相乘。由于统计上的依赖性,在这里我们将BA称为PCC并使用加法代替:
PCC =(TPR + TNR)/ 2
TPR = TP /(条件正例)= TP /(TP + FN)
TNR = TN /(条件负例)= TN /(TN + FP)。
PCC告诉我们分类器在检测任何一个分类中有多好,它是一个概率值[0,1]。请注意,即使我们的数据在生产中是均衡的,在肯定和否定情况下使用总精度也会产生误导,即使我们衡量绩效的批次可能不均衡,所以仅凭准确性并不是一个好方法。
生产问题
迫在眉睫的问题是如何在生成混淆矩阵时选择阈值?一种选择是选择一个阈值,以使PCC在测试集上的生产最大化。为了改善PCC的估计,可以对测试集进行重采样以获得良好的不确定性。
结论
我们尝试通过引入PCC或平衡精度作为二进制分类器的一种简单且可解释的性能指标来规避报告AUC。这很容易向非技术人员解释。可以引入一种改进的PCC,它考虑到更好的估计属性,但是主要解释仍然与正确分类的可能性相同。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28