中国科学技术大学王学钦教授开展“最优子集选取:从变量选择到样本选择”主题报告
2026-04-22

为增强学院学术氛围,加强学术科研合作,金融科技学院持续开展系列学术讲座。2026413日下午,学院特邀请中国科学技术大学王学钦教授作专题学术讲座。


在报告中,王学钦教授从一个统计推断中的经典难题出发:如何在处理异常值的同时,保持参数估计的统计效率?他指出,传统的稳健估计方法——如Huber估计、MM估计或基于$l_1$惩罚的均值漂移模型——虽能在一定程度上抵御异常值影响,但由于采用软降权或收缩策略,不可避免地引入了估计偏差,也无法直接识别出哪些样本是异常值。针对这一困境,王教授团队创造性地提出了自适应异常值检测与估计(AODE)框架,将最优子集选取的思想从传统的变量选择拓展至样本选择。该框架采用$l_0$约束的均值漂移模型,其最引人注目的特性是实现所谓的“神谕重拟合”:一旦异常点被准确识别并剔除,对剩余干净数据的估计即等价于无偏的普通最小二乘法,从而达到了统计效率的理论上限。面对$l_0$优化带来的组合爆炸难题以及多异常值情形下产生的掩蔽效应,王教授团队引入了观测值层面的“块拼接”搜索算法,通过动态改变样本几何结构来确保全局最优性。同时,配合稀疏信息准则(SIC),该方法能够在几乎零额外计算成本的条件下自动确定异常值的比例。王教授还展示了该方法在UK Biobank临床数据上的实证结果。相比于现有主流方法,AODE在计算速度、支撑集(异常值集合)恢复精度以及预测可靠性方面均表现出显著优势,展现出在大规模真实数据场景中的强大应用潜力。

讲座现场气氛热烈而活跃,在互动环节,在场师生围绕$l_0$优化的算法实现、异常值比例的自适应选择、方法对高维数据的适用性等问题踊跃提问。王教授耐心细致地解答,现场讨论气氛热烈。讲座结束后,学院陈海强院长为嘉宾颁发感谢函,感谢王学钦老师的精彩分享。

主讲嘉宾介绍:

王学钦,中国科学技术大学讲席教授,2003年毕业于宾汉姆顿大学,教育部高层次人才入选者,国际统计学会(ISI)当选会员。现担任教育部高等学校统计学类专业教学指导委员会委员、中国现场统计研究会副理事长、中国现场统计研究会教育统计与管理分会理事长,主要研究方向为大规模复杂数据的统计学理论、方法与算法;统计机器学习;精准医疗;医疗政策;风险管理和政策评估。