加权最小二乘(中)
扫描二维码
随时随地手机看文章
WLS 的求解方法需根据模型的 “线性 / 非线性” 特性选择,核心是在权重约束下找到使 “加权残差平方和” 最小的参数值。对于线性模型(即参数与观测数据呈线性关系),WLS 可通过数学推导得到 “闭式解”—— 即直接通过矩阵运算计算出最优参数,无需迭代过程,计算效率较高。但需注意,当模型存在 “多重共线性”(即部分参数之间存在线性关联)时,闭式解可能出现数值不稳定,此时需引入 “正则化” 技术,通过添加微小的约束项保证计算结果的可靠性。对于非线性模型(即参数与观测数据呈非线性关系,如指数模型、对数模型),由于无法直接推导闭式解,需采用 “迭代优化” 方法逐步逼近最优解。常用的迭代方法包括高斯 - 牛顿法与迭代加权最小二乘(IRLS):高斯 - 牛顿法通过将非线性模型在当前参数估计值附近 “线性化”,转化为线性 WLS 问题求解,再迭代更新参数直至收敛;IRLS 则进一步将权重与参数估计绑定,在每次迭代中同步更新权重与参数 —— 例如在处理异常值时,通过迭代降低异常值的权重,最终实现对异常值不敏感的稳健估计。迭代方法的关键在于 “初始值选择” 与 “收敛性控制”:初始值需尽可能接近真实参数,否则可能收敛到局部最优解;收敛性控制则通过设置迭代次数上限或残差变化阈值,平衡计算效率与估计精度。
WLS 的跨领域应用广泛,其核心价值在于 “适配数据异质性”,为不同场景下的实际问题提供灵活且高效的优化方案。在统计分析与经济预测中,WLS 是处理异方差数据的标准工具:例如在居民消费支出研究中,高收入群体的消费数据受投资、储蓄等因素影响,波动(噪声)更大,采用 WLS 按收入分组赋予权重(低收入组权重高、高收入组权重低),可使回归模型更准确反映收入与消费的真实关联;在宏观经济预测中,对近期经济数据赋予高权重、远期数据赋予低权重,可提升预测模型对短期趋势的敏感度。在计算机视觉与 SLAM(即时定位与地图构建)中,WLS 是后端优化的核心组件:在相机标定中,通过 WLS 优化相机内参(焦距、主点)与外参(旋转、平移),降低畸变区域数据的干扰,使图像重投影误差从传统方法的 1.5 像素降至 0.8 像素以内;在 SLAM 后端融合多传感器数据时,对精度高的 LiDAR 深度数据赋予高权重,对弱纹理环境下的视觉特征赋予低权重,可使机器人位姿估计的累积漂移降低 40% 以上。
在信号处理与通信领域,WLS 用于信号恢复与信道补偿:在无线通信中,不同频率的信号受信道衰减影响不同,通过 WLS 为衰减小、信噪比高的信号赋予高权重,可有效补偿信道失真,提升信号解调精度;在语音增强中,对清晰语音帧赋予高权重、对含噪声或静音的帧赋予低权重,可在去除背景噪声的同时保留语音细节,使语音清晰度提升 20% 以上。在机器学习与模式识别中,WLS 用于样本不平衡与模型优化:在疾病诊断的分类任务中,少数类样本(如罕见病病例)的误分类代价更高,通过 WLS 为少数类样本赋予高权重,可提升模型对罕见病例的识别能力;在神经网络训练中,采用加权损失函数(本质是 WLS 思想的延伸),让模型更关注难分样本(如模糊图像、相似类别样本),可显著提升模型的泛化能力。