Python批量图片超分辨率放大：RealESRGAN实战指南-AI智能范式网

Python批量图片超分辨率放大：RealESRGAN实战指南

GameFinder

1. 项目背景与核心价值

最近在整理老照片和设计素材时，经常遇到一个头疼的问题——那些早年拍摄或下载的低分辨率图片，在现在的4K显示器上查看简直惨不忍睹。传统的图像放大方法（如Photoshop的"图像大小"调整）往往会让图片变得模糊不清，边缘出现锯齿。直到发现了RealESRGAN这个基于AI的超分辨率重建工具，才真正解决了这个痛点。

RealESRGAN是腾讯ARC实验室开源的图像超分辨率算法，相比传统的插值放大方法，它通过深度卷积神经网络学习图像的高频细节，能够智能地补充放大过程中丢失的纹理信息。实测下来，4倍放大后的图片依然能保持惊人的清晰度，特别是对于动漫、插画这类内容，效果更是惊艳。

但官方工具每次只能处理单张图片，当需要批量处理整个文件夹时就很麻烦。于是我用Python写了个脚本，实现以下核心功能：

自动遍历指定文件夹的所有图片
调用RealESRGAN进行无损放大
可选择保留原图或直接替换
支持进度显示和错误跳过

2. 环境准备与工具链搭建

2.1 基础环境配置

推荐使用Python 3.8+环境，实测在Windows和Linux下均可运行。需要提前安装：

bash复制pip install opencv-python pillow tqdm

注意：RealESRGAN官方要求CUDA 10.2+环境以获得GPU加速。如果没有NVIDIA显卡，可以添加--cpu参数运行，但处理速度会明显下降。

2.2 RealESRGAN模型安装

首先克隆官方仓库并安装依赖：

bash复制git clone https://github.com/xinntao/Real-ESRGAN.git
cd Real-ESRGAN
pip install -r requirements.txt

然后下载预训练模型（推荐使用通用的RealESRGAN_x4plus模型）：

bash复制wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth -P weights/

2.3 脚本依赖检查

创建requirements.txt文件包含以下内容：

code复制numpy>=1.21.0
opencv-python>=4.5.4
Pillow>=9.0.0
tqdm>=4.62.0

运行pip install -r requirements.txt安装所有依赖。

3. 脚本核心逻辑解析

3.1 文件遍历与格式处理

使用Python的os.walk递归遍历文件夹，通过文件扩展名过滤出支持的图片格式：

python复制SUPPORTED_EXTS = ['.jpg', '.jpeg', '.png', '.bmp', '.tiff']

def find_images(folder):
    for root, _, files in os.walk(folder):
        for file in files:
            if os.path.splitext(file)[1].lower() in SUPPORTED_EXTS:
                yield os.path.join(root, file)

避坑提示：某些相机生成的.JPG文件实际是.jpeg格式，建议统一转为小写比较

3.2 RealESRGAN调用封装

通过subprocess调用RealESRGAN的命令行接口：

python复制def upscale_image(input_path, output_path, model_path, scale=4):
    cmd = [
        'python', 'inference_realesrgan.py',
        '--model_path', model_path,
        '--input', input_path,
        '--output', output_path,
        '--outscale', str(scale)
    ]
    if torch.cuda.is_available():
        cmd.extend(['--face_enhance'])
    
    result = subprocess.run(cmd, capture_output=True, text=True)
    if result.returncode != 0:
        raise RuntimeError(f"处理失败: {result.stderr}")

关键参数说明：

--face_enhance: 当检测到人脸时启用增强（需GPU）
--outscale: 放大倍数（2/4/8倍可选）
--tile: 大图像分块处理参数，默认400

3.3 批量处理与进度显示

使用tqdm库实现美观的进度条：

python复制def batch_process(input_folder, output_folder, model_path, replace=False):
    image_paths = list(find_images(input_folder))
    with tqdm(total=len(image_paths), desc="处理进度") as pbar:
        for img_path in image_paths:
            try:
                rel_path = os.path.relpath(img_path, input_folder)
                out_path = os.path.join(output_folder, rel_path)
                os.makedirs(os.path.dirname(out_path), exist_ok=True)
                
                upscale_image(img_path, out_path, model_path)
                
                if replace:
                    os.replace(out_path, img_path)
                
                pbar.update(1)
            except Exception as e:
                pbar.write(f"处理失败 {img_path}: {str(e)}")
                continue

4. 完整脚本实现

将上述模块组合成完整脚本batch_upscale.py：

python复制#!/usr/bin/env python3
import os
import subprocess
import argparse
from tqdm import tqdm
import torch

# ...（前述函数实现）

def main():
    parser = argparse.ArgumentParser()
    parser.add_argument('input', help='输入文件夹路径')
    parser.add_argument('--output', help='输出文件夹路径（默认新建upscaled子文件夹）')
    parser.add_argument('--model', default='weights/RealESRGAN_x4plus.pth', 
                       help='模型文件路径')
    parser.add_argument('--scale', type=int, default=4, choices=[2,4,8],
                       help='放大倍数')
    parser.add_argument('--replace', action='store_true',
                       help='直接替换原文件')
    args = parser.parse_args()

    output_folder = args.output or os.path.join(args.input, 'upscaled')
    batch_process(args.input, output_folder, args.model, args.replace)

if __name__ == '__main__':
    main()

5. 使用示例与效果对比

5.1 基础使用方法

处理整个文件夹并保存到新位置：

bash复制python batch_upscale.py /path/to/images --output /path/to/output

直接替换原图（谨慎使用）：

bash复制python batch_upscale.py /path/to/images --replace

5.2 效果对比测试

使用512x512测试图片进行4倍放大：

指标	双三次插值	RealESRGAN
处理时间	0.5s	8.2s
文件大小	1.2MB	3.8MB
PSNR	28.6	32.1
主观清晰度	明显模糊	边缘锐利

5.3 不同场景处理建议

根据内容类型推荐参数：

自然照片：使用默认x4plus模型，添加--face_enhance
动漫/插画：可尝试RealESRGAN_x4plus_anime专用模型
文字类图片：建议scale=2，避免过度锐化

6. 常见问题与优化技巧

6.1 性能优化方案

GPU内存不足：

bash复制python batch_upscale.py --tile 200  # 减小分块大小

批量处理中断恢复：

python复制# 在batch_process函数中添加：
if os.path.exists(out_path) and os.path.getsize(out_path) > 0:
    pbar.update(1)
    continue

6.2 典型错误处理

错误现象	可能原因	解决方案
CUDA out of memory	图像太大或tile值过高	减小--tile参数或使用--cpu
输出图片全黑	颜色空间不兼容	用Pillow先转换为RGB模式
处理速度异常慢	未检测到GPU	检查CUDA和torch版本是否匹配

6.3 高级技巧

自定义模型集成：

python复制CUSTOM_MODELS = {
    'anime': 'path/to/anime_model.pth',
    'photo': 'path/to/photo_model.pth'
}

EXIF信息保留：

python复制from PIL import Image
img = Image.open(input_path)
exif = img.info.get('exif')
# 处理后保存时添加
img.save(output_path, exif=exif)

多进程加速（适用于CPU模式）：

python复制from multiprocessing import Pool
with Pool(4) as p:  # 4进程
    p.starmap(upscale_image, task_list)

7. 实际应用案例

7.1 老照片修复流程

使用--scale 2进行初步放大
用PhotoShop修复明显瑕疵
再次用--scale 2最终输出

7.2 电商素材处理

批量处理产品图片时，建议：

创建不同尺寸的输出文件夹（1x, 2x, 3x）
添加水印检测跳过机制

python复制if 'watermark' in img_path.lower():
    continue

7.3 视频帧提取增强

结合FFmpeg实现视频增强流程：

bash复制ffmpeg -i input.mp4 -qscale:v 1 frames/%04d.jpg
python batch_upscale.py frames --replace
ffmpeg -r 30 -i frames/%04d.jpg -c:v libx264 output.mp4

这个脚本在我处理数千张产品图片和老照片的过程中表现非常稳定，特别是对于1990年代扫描的老照片，放大后的人物面部细节恢复效果令人惊喜。一个实用的建议是：对于特别重要的图片，可以先用小尺寸副本测试不同参数效果，再批量处理原图。