图像阈值化:从灰度分割到场景适配的基础图像处理技术(二)
扫描二维码
随时随地手机看文章
图像阈值化的技术演进经历了 “固定阈值→全局自适应阈值→局部自适应阈值” 三个阶段,每个阶段的技术创新均针对前一阶段在复杂场景中的局限性,逐步提升分割的鲁棒性与自动化水平。早期的阈值化方法以 “固定阈值” 为主,依赖人工经验根据图像灰度分布设定阈值(如文档处理中常设 127 为阈值),这种方法仅适用于灰度分布极简单的场景(如理想光照下的纯白背景文档),一旦图像存在光照不均(如文档边缘有阴影)、前景背景灰度重叠(如低对比度零件图),分割效果会急剧下降 —— 例如,阴影区域的文字灰度值可能高于固定阈值,被误判为背景,导致文字断裂。
为解决固定阈值的人工依赖与场景局限性,“全局自适应阈值” 方法应运而生,其核心是通过分析整幅图像的灰度直方图自动计算最优阈值,无需人工干预。Otsu 算法(最大类间方差法)是全局自适应阈值的经典代表,其设计逻辑是:假设图像灰度直方图存在前景与背景两个峰值,通过遍历所有可能的灰度值,找到使 “前景类内方差与背景类内方差之和最小、类间方差最大” 的灰度值作为阈值。这种方法无需先验知识,能自动适配灰度分布呈双峰或近似双峰的图像(如清晰的细胞图、无阴影的零件图),在工业检测、医学影像等场景中广泛应用 —— 例如,在零件表面缺陷检测中,Otsu 算法可自动分割出灰度值较低的缺陷区域,缺陷检出率较固定阈值提升 40% 以上。此外,迭代阈值法、基于熵的阈值法等也属于全局自适应阈值范畴,分别通过迭代优化阈值、最大化图像信息熵实现最优阈值选择,适用于不同灰度分布特征的图像。
然而,全局自适应阈值仍无法解决 “局部光照不均” 这一核心难题 —— 当图像存在明显的局部灰度差异(如文档中间亮、边缘暗,或户外拍摄的物体受阳光直射与阴影交替影响)时,整幅图像的灰度直方图呈现多峰分布,全局阈值无法兼顾所有区域,导致部分区域分割过度、部分区域分割不足。例如,户外拍摄的车牌图像中,阳光直射区域的车牌字符灰度值高,阴影区域的字符灰度值低,全局阈值会使直射区域的字符被误判为背景,阴影区域的背景被误判为字符。为应对这一挑战,“局部自适应阈值”(又称动态阈值)方法被提出,其核心思想是:将整幅图像划分为多个局部区域(如 8×8 或 16×16 像素的小块),对每个局部区域单独计算阈值(可采用 Otsu 或其他方法),再根据局部阈值分割该区域的像素。这种方法能自适应不同局部区域的光照差异,即使图像存在严重的光照不均,每个局部区域仍能保持良好的前景背景分离效果。
Sauvola 算法是局部自适应阈值在文档处理中的典型应用,其在计算局部阈值时引入了 “局部均值与局部标准差” 的校正项,使阈值能根据局部区域的对比度动态调整 —— 例如,对比度低的阴影区域,阈值会适当降低,避免文字被误判为背景;对比度高的亮区,阈值保持稳定,防止背景噪点被误判为文字。在文档扫描、车牌识别等场景中,Sauvola 算法的分割效果远优于全局阈值,文字断裂率降低 50% 以上,且能有效保留细笔画(如 “1”“丶”)。此外,局部自适应阈值还可结合高斯加权、边缘保护等策略,进一步提升分割精度,例如,对局部区域的像素进行高斯加权后再计算阈值,可减少噪声对局部阈值的干扰,使分割边界更平滑。