全局自适应阈值的核心原理
扫描二维码
随时随地手机看文章
基于类间方差的方法以 Otsu 算法(最大类间方差法)为代表,是最经典且应用最广的全局自适应阈值技术。其核心思想源于对 “灰度分类纯度” 的追求:将图像所有像素按某一灰度阈值分为前景(C₁)与背景(C₂)两类,计算两类的均值、方差与像素占比,定义 “类间方差” 为两类均值差异的平方乘以各自像素占比的乘积 —— 类间方差越大,说明前景与背景的灰度差异越显著;同时,类内方差(两类内部灰度的离散程度)越小,说明同类像素的灰度一致性越高。Otsu 算法通过遍历 0-255 所有可能的灰度值,找到使 “类间方差最大” 的灰度值作为阈值,此时前景与背景的分割效果最优。这种方法无需任何先验知识,对双峰或近似双峰灰度直方图的图像(如清晰的细胞涂片、无阴影的零件缺陷图)适配性极强 —— 例如,在白细胞图像中,细胞核灰度值集中在 80-120(前景),细胞质集中在 180-220(背景),Otsu 算法能精准找到 150 左右的阈值,将细胞核完整分割,分割准确率可达 95% 以上。
基于迭代优化的方法则通过 “逐步逼近” 实现阈值优化,核心逻辑是:先设定一个初始阈值(通常为图像灰度的均值或中值),将图像分为前景与背景,计算两类的灰度均值;再以两类均值的平均值作为新阈值,重复上述过程,直至两次阈值的差值小于预设精度(如 1),此时的阈值即为最优解。这种方法的优势在于计算逻辑简单,无需遍历所有灰度值,尤其适用于灰度分布相对集中的图像(如低对比度的工业零件图)。例如,在铝合金零件表面划痕检测中,划痕灰度值(100-130)与基体灰度值(140-170)差异较小,迭代阈值法可通过 3-5 次迭代找到 135 左右的阈值,避免 Otsu 算法在近似单峰直方图中出现的阈值偏移问题。
基于信息熵的方法则从 “信息最大化” 角度定义最优阈值,核心依据是 “图像的信息熵越大,包含的灰度信息越丰富”。该方法将阈值分割视为 “对图像灰度信息的压缩”,最优阈值需满足 “分割后前景与背景的信息熵之和最大”—— 即通过阈值划分,保留图像中最具区分度的灰度信息,剔除冗余。这种方法对灰度分布复杂(如多峰但存在主双峰)的图像适配性更好,例如,在含少量杂质的细胞图像中,杂质灰度值(50-70)、细胞核(90-120)、细胞质(180-220)形成三峰直方图,基于熵的方法能忽略杂质的弱峰,聚焦细胞核与细胞质的主双峰,找到 150 左右的阈值,避免杂质对分割的干扰。