机器视觉零基础入门：（四）直方图均衡化

直方图均衡化是一种基础图像增强技术，通过重新分配像素灰度值改善低对比度图像的视觉效果。其核心步骤包括分析灰度分布、计算累积概率、映射新灰度值并生成结果。该方法能有效拉伸集中分布的灰度区间，释放被压缩的细节，但存在全局处理导致局部失真、灰度级合并等局限性。代码实现展示了从直方图统计到均衡化映射的全过程，并对比处理前后的图像效果。实际应用中需注意该方法对高对比度图像可能产生过度增强的问题，需要根据场景

瑶望

848人浏览 · 2025-10-23 11:23:02

瑶望 · 2025-10-23 11:23:02 发布

文章目录

前言
一、直方图均衡化
- 1.底层逻辑定义
二、代码实现
三、局限性与优化方向
- 1.核心局限性
- 2.优化方案
总结

前言

直方图均衡化是图像处理领域经典且基础的对比度增强技术，其核心价值在于以简洁的统计逻辑，解决低对比度图像中 “灰度值分布集中、细节被压缩” 的共性问题 —— 无需依赖复杂模型或先验知识，仅通过调整像素灰度的分布状态，即可让昏暗、模糊的图像实现细节释放与视觉清晰度提升。
举个简单的例子：家中的老照片，因年代久远、冲洗技术限制，照片里长辈的面部细节、衣物花纹被压缩在狭窄的灰度范围内，看起来发灰、缺乏层次。而直方图均衡化的作用，就像是 “重新整理衣柜”—— 通过统计每个灰度值的出现频率，将原本集中的灰度区间拉伸到全范围，让 “偏黑” 的细节亮起来，“偏灰” 的层次分离开。比如上述监控画面经过处理后，老照片里长辈的发丝纹理、衣物的图案细节也能重新被识别。
在这里插入图片描述

一、直方图均衡化

1.底层逻辑定义

直方图均衡化的本质是 “对图像灰度值进行重新分配”，核心目标是让每个灰度值的出现概率尽可能接近，从而释放被压缩的细节。整个过程可拆分为 “析分布、算累积、做映射、生结果” 四个关键步骤：

（1）析分布

首先获取原始图像的灰度分布特征，即统计每个灰度值对应的像素数量。设原始图像尺寸为H×W，总像素数N=H×W，灰度值r_k(k=0,1,…,255）的出现次数为n_k，则该灰度值的 “概率密度”（出现频率）为：p(r_k) = n_k/N。概率密度p(r_k)表示灰度值r_k在图像中所占的像素比例，所有灰度值的概率密度之和为 1。
举个例子：一张 300×300 的低对比度图像像素总和N=90000，灰度值 50 的出现次数n_50=4500，则p(50) = 4500/90000 = 0.05，即灰度值 50 占总像素的 5%。通过统计所有灰度值的p(r_k)，可得到原始灰度直方图，直观看到灰度分布集中的区间。

（2）算累计

累积分布函数（Cumulative Distribution Function，CDF）是直方图均衡化的核心桥梁，它表示 “灰度值小于等于r_k的所有像素的累积概率”，公式为：
在这里插入图片描述

这里需要明确两个关键意义：一是CDF的取值范围始终在[0,1]之间，因为它是所有小于等于r_k的概率之和，最小为0（k=0时若n_0=0），最大为1（k=255时涵盖所有像素）；二是CDF具有“单调不减”的特性——随着k的增大（灰度值升高），累积概率只会增加或保持不变，不会下降，这是后续灰度映射不会出现“灰度反转”的关键保障。
还是用上面300×300的图像举例，假设灰度值0-49的累积像素数为27000，那么CDF(50) = (27000 + 4500)/90000 = 0.35，意味着图像中灰度值≤50的像素占比35%。如果把原始灰度直方图比作“高低不平的山坡”，CDF就是从山脚到当前位置的“累积高度占比”，能清晰反映低灰度、中灰度、高灰度像素的整体占比情况。

（3）做映射

得到CDF后，就需要通过映射函数将原始灰度值r_k转换为新的灰度值s_k，这一步是均衡化的“执行环节”。由于图像的灰度值范围通常是[0,255]（8位灰度图），而CDF的范围是[0,1]，因此映射公式为：
在这里插入图片描述

其中round()是四舍五入函数，目的是将计算出的浮点数转换为整数灰度值。这个公式的核心逻辑是“按累积概率分配新灰度”——原始灰度值对应的CDF越大，说明其在整体灰度分布中所处的“累积位置”越靠前，对应到新的均匀分布中，就会被分配到更高的灰度值。
举个具体的计算：若原始灰度值r_30对应的CDF(r_30)=0.1，那么s_30=round(0.1×255)=26；若r_100对应的CDF(r_100)=0.6，那么s_100=round(0.6×255)=153。可以发现，原始灰度值之间的“概率差距”，通过CDF映射后转化为“灰度值差距”，原本集中在狭窄区间的灰度值，会被拉伸到更广泛的区间内。
这里有个关键注意点：由于CDF是单调不减的，原始灰度值从小到大排列时，新灰度值s_k也会保持从小到大的顺序，不会出现“原始灰度100对应新灰度50，原始灰度90对应新灰度60”的反转情况，这就保证了图像的明暗逻辑不会混乱——原本暗的区域处理后依然偏暗，原本亮的区域依然偏亮，只是对比度被增强了。
这里可能会有一个疑惑，为什么不是单独像素点的像素值乘上255，而是累加。举个例子：
假设一张图像只有 3 个灰度值（0、1、2）各灰度的像素数的统计。
在这里插入图片描述
如果是单个概率映射，最后像素值为1的像素点映射后像素值变成了62，2变成了13，图像的明暗发生了改变。而累加概率映射则不会。
这就是为什么必须累加 ——只有累加才能锁定每个灰度的 “明暗顺序” 和 “整体位置”，映射后灰度不会颠倒，还能铺满全范围。

（4）生结果

完成所有原始灰度值到新灰度值的映射后，就可以遍历图像的每个像素，将每个像素的原始灰度值r_k替换为对应的s_k，从而生成均衡化后的图像。最后，我们可以通过绘制新图像的灰度直方图，直观验证均衡化效果——原本集中在某一区间的直方图，会被“拉平”到[0,255]的全范围，虽然不一定能做到绝对均匀（受原始灰度分布离散性影响），但整体分布会更分散，细节自然就显现出来了。
在这里插入图片描述

二、代码实现

import cv2
import matplotlib.pyplot as plt

img = cv2.imread("lenna.png")
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 计算原始图像的灰度直方图
def calculate_histogram(image):
    hist = [0] * 256  
    h, w = image.shape
    total_pixels = h * w
    for i in range(h):
        for j in range(w):
            gray_level = image[i, j]
            hist[gray_level] += 1
    # 计算概率密度
    prob_hist = [count / total_pixels for count in hist]
    return hist, prob_hist, total_pixels

original_hist, original_prob, total_pixels = calculate_histogram(gray_img)

# 计算CDF并完成灰度映射
def histogram_equalization(gray_img, prob_hist, total_pixels):
    # 计算CDF
    cdf = [0] * 256
    cdf[0] = prob_hist[0]
    for k in range(1, 256):
        cdf[k] = cdf[k-1] + prob_hist[k]
    # 灰度映射
    mapping = [round(cdf[k] * 255) for k in range(256)]
    # 生成均衡化图像
    h, w = gray_img.shape
    eq_img = gray_img.copy()
    for i in range(h):
        for j in range(w):
            eq_img[i, j] = mapping[gray_img[i, j]]
    return eq_img, cdf, mapping

eq_img, cdf, mapping = histogram_equalization(gray_img, original_prob, total_pixels)

# 计算均衡化后的直方图
eq_hist, eq_prob, _ = calculate_histogram(eq_img)

# 绘制对比图（原图、均衡化图、原始直方图、均衡化直方图）
plt.figure(figsize=(12, 8))

# 绘制原图
plt.subplot(2, 2, 1)
plt.imshow(gray_img, cmap="gray")
plt.title("Original Gray Image")
plt.axis("off")

# 绘制均衡化图
plt.subplot(2, 2, 2)
plt.imshow(eq_img, cmap="gray")
plt.title("Equalized Gray Image")
plt.axis("off")

# 绘制原始直方图
plt.subplot(2, 2, 3)
plt.bar(range(256), original_prob, width=1)
plt.title("Original Gray Histogram")
plt.xlabel("Gray Level")
plt.ylabel("Probability Density")
plt.xlim([0, 255])

# 绘制均衡化直方图
plt.subplot(2, 2, 4)
plt.bar(range(256), eq_prob, width=1)
plt.title("Equalized Gray Histogram")
plt.xlabel("Gray Level")
plt.ylabel("Probability Density")
plt.xlim([0, 255])

plt.tight_layout()
plt.show()

三、局限性与优化方向

虽然直方图均衡化简单高效，但在实际应用中存在明显的局限性，需要根据场景选择或优化：

1.核心局限性

全局均衡化导致局部失真：传统直方图均衡化是对全图像进行统一处理，若图像中存在大面积亮区域（如逆光场景中的天空），均衡化后会将该区域的灰度过度拉伸，导致暗部细节丢失，或出现“噪点放大”问题。比如监控画面中若有强光区域，全局均衡化后强光区域会变得惨白，而人物面部等暗部细节可能依然模糊。
灰度级合并问题：由于原始灰度值的CDF可能存在“跳跃”，映射后的新灰度值s_k可能会出现多个原始灰度值对应同一个新灰度值的情况，导致灰度级合并，部分精细细节会丢失。例如8位灰度图有256个灰度级，均衡化后可能只剩下180个左右的有效灰度级。
对高对比度图像不友好：若原始图像本身对比度正常，使用直方图均衡化后会过度增强对比度，导致图像色彩失真（彩色图中尤为明显），比如人像照片会出现“面部阴影过重、皮肤质感粗糙”的问题。

2.优化方案

针对上述局限性，行业内有多种优化算法，其中最常用的是自适应直方图均衡化（AHE）和限制对比度自适应直方图均衡化（CLAHE）：

AHE算法：核心思路是“分块处理”——将图像分割成多个小方块（称为“子块”），对每个子块单独进行直方图均衡化，然后通过插值法拼接子块，避免全局处理导致的局部失真。这种方法对局部细节丰富的图像效果较好，比如老照片中的面部细节，但容易出现“块效应”（子块之间的灰度突变），且在噪声较多的子块中会放大噪点。
CLAHE算法：在AHE的基础上增加了“对比度限制”机制——当子块的直方图中某一灰度值的频率过高时（超过设定的阈值），会将超出部分的像素“分配”到其他灰度值中，再进行均衡化。这种方法既保留了AHE增强局部细节的优势，又解决了块效应和噪点放大问题，是目前工业界应用最广泛的均衡化算法之一，常见于监控摄像头、医学影像处理（如X光片）等场景。

总结

直方图均衡化作为一种“无参数、轻量级”的对比度增强技术，其核心优势在于原理简单、计算高效，不需要GPU加速也能快速处理图像，因此在诸多场景中得到广泛应用。但是我们也要明确其局限性——全局均衡化不适合强光、高噪声场景，此时应选用CLAHE等优化算法。但无论如何，直方图均衡化作为图像处理的入门级核心技术。
（总目录跳转链接）