如何用Java案例实现图片二值化？

wen java案例 2026-06-16 4

用Java实现图片二值化的完整案例与实战指南

目录导读

二值化的核心原理与适用场景
Java图像处理环境搭建（BufferedImage与Graphics2D）
灰度化预处理：从RGB到亮度值
自适应阈值与全局阈值算法实现（Otsu、均值、三角形法）
完整代码案例：可运行的图片二值化工具类
性能优化与常见踩坑记录
问答环节：解决你开发中的5个高频问题

二值化的核心原理与适用场景

什么是图像二值化？
二值化是指将彩色或灰度图像转换为仅包含纯黑（0）与纯白（255）两种像素点的过程，每个像素的最终值由阈值决定：高于阈值设为白色，低于设为黑色，其本质是信息降维，保留边缘与轮廓,去除颜色与纹理噪声。

如何用Java案例实现图片二值化？

典型应用场景：

OCR文字识别前的预处理（去除背景色干扰）
二维码/条形码解析
车牌识别中的字符分割
文档扫描件的“去底色”处理

关键问题：阈值怎么选？固定值容易导致暗部细节丢失或亮部过曝，因此需要自适应算法（详见第4节）。

Java图像处理环境搭建

Java标准库javax.imageio与java.awt.image.BufferedImage已提供基础图像读写能力，无需第三方库,以下是一个典型读取与显示像素信息的代码片段：

import java.awt.image.BufferedImage;
import java.io.File;
import javax.imageio.ImageIO;
public class ImageBinarization {
    public static void main(String[] args) throws Exception {
        BufferedImage img = ImageIO.read(new File("input.jpg"));
        System.out.println("宽度: " + img.getWidth() + ", 高度: " + img.getHeight());
        // 获取像素值 (ARGB格式)
        int rgb = img.getRGB(0, 0); 
        // 提取R、G、B分量
        int red = (rgb >> 16) & 0xFF;
        int green = (rgb >> 8) & 0xFF;
        int blue = rgb & 0xFF;
    }
}

注意：getRGB()返回的int包含Alpha通道,提取颜色分量时需右移并掩码。

灰度化预处理：从RGB到亮度值

二值化前必须先将彩色图像转为灰度图，人眼对绿色最敏感,常用加权平均法：

public static int toGray(int rgb) {
    int alpha = (rgb >> 24) & 0xFF; // 保留alpha通道（可选）
    int r = (rgb >> 16) & 0xFF;
    int g = (rgb >> 8) & 0xFF;
    int b = rgb & 0xFF;
    int gray = (int)(0.299 * r + 0.587 * g + 0.114 * b);
    return (alpha << 24) | (gray << 16) | (gray << 8) | gray;
}

为什么不能直接取平均？
等权平均 (r+g+b)/3 会降低对比度，而人眼对绿光敏感度最高，0.299/0.587/0.114是ITU-R BT.601标准。

自适应阈值与全局阈值算法实现

1 全局固定阈值

public static BufferedImage fixedThreshold(BufferedImage gray, int threshold) {
    BufferedImage binary = new BufferedImage(gray.getWidth(), gray.getHeight(), BufferedImage.TYPE_BYTE_BINARY);
    for (int y = 0; y < gray.getHeight(); y++) {
        for (int x = 0; x < gray.getWidth(); x++) {
            int grayVal = gray.getRGB(x, y) & 0xFF;
            // TYPE_BYTE_BINARY模式：0为黑，1为白
            binary.setRGB(x, y, grayVal > threshold ? 0xFFFFFFFF : 0xFF000000);
        }
    }
    return binary;
}

局限：光照不均匀的图像效果极差。

2 Otsu最佳全局阈值（大津法）

自动最大化类间方差，代码实现如下（核心部分）：

public static int otsuThreshold(BufferedImage gray) {
    int[] histogram = new int[256];
    int total = gray.getWidth() * gray.getHeight();
    // 填充直方图
    for (int y = 0; y < gray.getHeight(); y++) {
        for (int x = 0; x < gray.getWidth(); x++) {
            int v = gray.getRGB(x, y) & 0xFF;
            histogram[v]++;
        }
    }
    double sum = 0;
    for (int i = 0; i < 256; i++) sum += i * histogram[i];
    double sumB = 0, wB = 0, wF = 0, varMax = 0, threshold = 0;
    sumB = 0; wB = 0;
    for (int t = 0; t < 256; t++) {
        wB += histogram[t];
        if (wB == 0) continue;
        wF = total - wB;
        if (wF == 0) break;
        sumB += t * histogram[t];
        double meanB = sumB / wB;
        double meanF = (sum - sumB) / wF;
        double varBetween = wB * wF * (meanB - meanF) * (meanB - meanF);
        if (varBetween > varMax) {
            varMax = varBetween;
            threshold = t;
        }
    }
    return (int)threshold;
}

Otsu的局限性：当直方图呈单峰或双峰差距极小时（如医学X-Ray）,效果会较差。

3 局部自适应阈值（高斯/均值滤波）

使用一个滑动窗口（例如15x15），窗口内计算局部阈值，适合光照不均的场景，以下为OpenCV风格的简化实现（纯Java实现窗口均值）：

public static BufferedImage adaptiveThreshold(BufferedImage gray, int blockSize, int C) {
    // blockSize必须为奇数
    int width = gray.getWidth();
    int height = gray.getHeight();
    BufferedImage binary = new BufferedImage(width, height, BufferedImage.TYPE_BYTE_BINARY);
    // 对每个像素计算局部均值
    for (int y = 0; y < height; y++) {
        for (int x = 0; x < width; x++) {
            int sum = 0, count = 0;
            for (int dy = -blockSize/2; dy <= blockSize/2; dy++) {
                for (int dx = -blockSize/2; dx <= blockSize/2; dx++) {
                    int nx = x + dx, ny = y + dy;
                    if (nx >= 0 && nx < width && ny >= 0 && ny < height) {
                        sum += (gray.getRGB(nx, ny) & 0xFF);
                        count++;
                    }
                }
            }
            int localMean = sum / count;
            int pixel = gray.getRGB(x, y) & 0xFF;
            binary.setRGB(x, y, pixel > localMean - C ? 0xFFFFFFFF : 0xFF000000);
        }
    }
    return binary;
}

参数C ：经验值通常为10~15,用于微调阈值敏感度。

完整代码案例：可运行的图片二值化工具类

整合以上所有方法,提供命令行调用接口：

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
public class BinarizationTool {
    public static void main(String[] args) throws Exception {
        if (args.length < 2) {
            System.out.println("用法: java BinarizationTool <input> <output> [method]");
            System.out.println("method: fixed(默认), otsu, adaptive");
            return;
        }
        BufferedImage img = ImageIO.read(new File(args[0]));
        BufferedImage gray = toGrayscale(img);
        String method = args.length >= 3 ? args[2] : "fixed";
        BufferedImage result;
        switch (method) {
            case "otsu":
                int th = otsuThreshold(gray);
                result = fixedThreshold(gray, th);
                break;
            case "adaptive":
                result = adaptiveThreshold(gray, 31, 10);
                break;
            default:
                result = fixedThreshold(gray, 128);
        }
        ImageIO.write(result, "PNG", new File(args[1]));
    }
    // 将上述所有方法并入此类（toGrayscale, fixedThreshold, otsuThreshold, adaptiveThreshold）
}

运行示例：
java BinarizationTool scan.jpg output_otsu.png otsu

性能优化与常见踩坑记录

性能瓶颈：

直接操作getRGB/setRGB耗时高（每个像素调用一次JNI）
建议使用int[] pixels = img.getRGB(0, 0, width, height, null, 0, width)批量获取数组,处理完后再写入。

常见错误：

类型混淆：BufferedImage.TYPE_BYTE_BINARY强制每像素1位，写入0xFF000000会被截断，需直接设0或0xFFFFFFFF。
边界越界：自适应阈值的窗口靠近边缘时需检查坐标有效范围（已在第4.3节处理）。
Java版本兼容：ImageIO对TIFF格式支持有限,建议先用ImageMagick转为PNG。

问答环节：解决你开发中的5个高频问题

Q1：为什么二值化后文字边缘出现锯齿？
A：这是由于直方图双峰重叠导致的噪声，可先做中值滤波（3x3窗口）去噪，再二值化,效果显著提升。

Q2：Otsu算法得出的阈值总是偏暗？
A：当背景像素占比非常高时，Otsu会让背景均值牵引阈值，可改为三角形法（迭代逼近）,或者对直方图做平滑。

Q3：Java自带的二值化是否可以不用写代码？
A：javax.imageio.plugins并无现成二值化插件，所有需要手动实现，但可以使用 JavaCV（OpenCV封装）直接调用Imgproc.threshold()。

Q4：如何批量处理10000张图片并写入结果？
A：在main方法中添加循环读取文件，并使用ExecutorService多线程并行处理（注意ImageIO不是线程安全的，但读入后每个图片独立处理）。

Q5：二值化后出现‘椒盐噪声’如何消除？
A：对二值图做一次形态学开运算（先腐蚀再膨胀），Java中可用ConvolveOp实现3x3结构元素,或自定义核。

本文从原理到实战，覆盖了Java原生API实现图片二值化的完整路径，代码可直接用于OCR预处理、文档扫描等场景，若需更高性能，建议结合OpenCV的C++库（通过JavaCPP绑定）。