双目相机标定与极线校正的Python实现

Fesgrome

1. 双目相机标定与极线校正概述

双目视觉系统作为计算机视觉领域的重要工具，其核心在于通过两个相机从不同角度获取场景信息，进而恢复三维空间结构。要实现这一目标，相机标定和极线校正是不可或缺的前置步骤。

在实验室调试双目系统时，我发现很多初学者容易忽视标定质量对后续立体匹配的影响。一个典型的误区是认为只要完成了标定流程就万事大吉，实际上重投影误差超过0.5像素时，深度计算的精度就会显著下降。这也是为什么我们需要开发这套包含完整质量评估功能的标定工具。

这套Python工具集主要解决以下几个实际问题：

提供可视化界面简化标定流程
自动过滤无效标定图像
直观展示标定精度指标
实现高质量的极线校正
标准化参数存储格式

提示：标定板的选择直接影响标定精度。经过多次测试，我推荐使用10x7的棋盘格（9x6内角点），这种尺寸在大多数场景下既能保证角点检测稳定性，又不会因过大而难以拍摄完整。

2. 开发环境搭建与依赖配置

2.1 基础环境准备

在开始编码前，需要配置以下开发环境：

bash复制# 创建虚拟环境（推荐）
python -m venv stereo_calib
source stereo_calib/bin/activate  # Linux/Mac
stereo_calib\Scripts\activate    # Windows

# 安装核心依赖
pip install opencv-contrib-python==4.5.5.64
pip install PyQt5==5.15.7
pip install matplotlib==3.5.1
pip install numpy==1.21.5

特别注意版本兼容性问题：

OpenCV必须使用contrib版本，因为标准版缺少某些立体视觉功能
PyQt5与Python3.9+可能存在兼容性问题，建议使用Python3.8
Matplotlib建议使用3.5.x系列，其绘图API最稳定

2.2 硬件准备要点

根据项目经验，硬件配置需注意：

相机选择：建议使用全局快门相机，避免卷帘快门带来的运动模糊
基线距离：两相机间距一般为50-200mm，具体取决于观测距离
标定板：建议使用铝制棋盘格，比纸质板更平整
照明条件：均匀漫射光最佳，避免强烈反光

3. PyQt界面设计与实现

3.1 主界面架构设计

采用MVC模式构建GUI，主要包含以下功能模块：

python复制class MainWindow(QMainWindow):
    def __init__(self):
        super().__init__()
        # 状态变量
        self.left_images = []
        self.right_images = []
        self.calib_params = None
        
        # 初始化UI
        self.init_ui()
        
    def init_ui(self):
        """初始化界面组件"""
        self.setWindowTitle('双目相机标定系统 v1.0')
        self.setGeometry(100, 100, 1200, 800)
        
        # 主布局采用QHBoxLayout
        main_widget = QWidget()
        self.setCentralWidget(main_widget)
        layout = QHBoxLayout(main_widget)
        
        # 左侧控制面板
        control_panel = self._create_control_panel()
        layout.addWidget(control_panel, stretch=1)
        
        # 右侧图像显示区域
        self.image_display = QLabel()
        self.image_display.setAlignment(Qt.AlignCenter)
        layout.addWidget(self.image_display, stretch=3)

3.2 功能按钮实现

为每个核心功能创建专用按钮和槽函数：

python复制def _create_control_panel(self):
    """创建左侧控制面板"""
    panel = QWidget()
    layout = QVBoxLayout(panel)
    
    # 图像加载按钮组
    load_group = QGroupBox("图像加载")
    load_layout = QVBoxLayout()
    
    self.btn_load_left = QPushButton("加载左相机图像")
    self.btn_load_left.clicked.connect(self.load_left_images)
    load_layout.addWidget(self.btn_load_left)
    
    # ...其他按钮类似实现
    
    # 标定执行按钮
    btn_calibrate = QPushButton("执行标定")
    btn_calibrate.clicked.connect(self.run_calibration)
    layout.addWidget(btn_calibrate)
    
    return panel

4. 双目标定核心算法实现

4.1 棋盘格检测优化

标准棋盘格检测存在以下常见问题：

低对比度环境下检测失败
部分遮挡导致角点丢失
透视变形严重时精度下降

改进后的检测流程：

python复制def enhanced_find_chessboard(img, pattern_size=(9,6)):
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    
    # 预处理增强
    gray = cv2.GaussianBlur(gray, (5,5), 0)
    gray = cv2.equalizeHist(gray)
    
    # 多尺度检测
    for scale in [1.0, 0.8, 1.2]:
        resized = cv2.resize(gray, None, fx=scale, fy=scale)
        ret, corners = cv2.findChessboardCorners(resized, pattern_size, None)
        
        if ret:
            # 坐标转换回原图尺寸
            corners = corners / scale
            # 亚像素优化
            criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001)
            corners = cv2.cornerSubPix(gray, corners, (11,11), (-1,-1), criteria)
            return True, corners
    
    return False, None

4.2 立体标定参数计算

双目标定相比单目标定增加了相机间几何关系的计算：

python复制def stereo_calibrate(obj_points, img_points_left, img_points_right, img_size):
    # 单目标定获取内参
    ret, mtx1, dist1, _, _ = cv2.calibrateCamera(
        obj_points, img_points_left, img_size, None, None)
    
    ret, mtx2, dist2, _, _ = cv2.calibrateCamera(
        obj_points, img_points_right, img_size, None, None)
    
    # 立体标定
    flags = cv2.CALIB_FIX_INTRINSIC  # 使用已标定的内参
    ret, _, _, _, _, R, T, E, F = cv2.stereoCalibrate(
        obj_points, img_points_left, img_points_right,
        mtx1, dist1, mtx2, dist2, img_size,
        flags=flags)
    
    return mtx1, dist1, mtx2, dist2, R, T

5. 极线校正实现与优化

5.1 校正变换计算

立体校正的核心是使两相机的图像平面共面且行对齐：

python复制def compute_rectification(mtx1, dist1, mtx2, dist2, img_size, R, T):
    # 计算校正变换
    R1, R2, P1, P2, Q, _, _ = cv2.stereoRectify(
        mtx1, dist1, mtx2, dist2, img_size, R, T,
        alpha=0)  # alpha=0表示不保留黑色区域
    
    # 生成映射表
    map1x, map1y = cv2.initUndistortRectifyMap(
        mtx1, dist1, R1, P1, img_size, cv2.CV_32FC1)
    map2x, map2y = cv2.initUndistortRectifyMap(
        mtx2, dist2, R2, P2, img_size, cv2.CV_32FC1)
    
    return map1x, map1y, map2x, map2y, Q

5.2 校正质量评估

校正后需要验证以下指标：

极线约束：对应点应在同一水平线上
重叠区域：有效视差计算区域
畸变消除：直线应保持笔直

评估代码示例：

python复制def evaluate_rectification(left_img, right_img, map1x, map1y, map2x, map2y):
    # 执行校正
    rect_left = cv2.remap(left_img, map1x, map1y, cv2.INTER_LANCZOS4)
    rect_right = cv2.remap(right_img, map2x, map2y, cv2.INTER_LANCZOS4)
    
    # 绘制特征点验证极线约束
    sift = cv2.SIFT_create()
    kp1, des1 = sift.detectAndCompute(rect_left, None)
    kp2, des2 = sift.detectAndCompute(rect_right, None)
    
    # 特征匹配
    bf = cv2.BFMatcher()
    matches = bf.knnMatch(des1, des2, k=2)
    
    # 筛选优质匹配
    good = []
    for m,n in matches:
        if m.distance < 0.75*n.distance:
            good.append(m)
    
    # 计算纵坐标差异
    y_diffs = [abs(kp1[m.queryIdx].pt[1] - kp2[m.trainIdx].pt[1]) 
               for m in good]
    avg_y_diff = np.mean(y_diffs)
    
    return rect_left, rect_right, avg_y_diff

6. 标定结果存储与加载

6.1 XML存储格式优化

改进后的存储方案包含更多元数据：

python复制def save_calibration_results(filename, params):
    root = ET.Element('StereoCalibration')
    
    # 添加系统信息
    sys_info = ET.SubElement(root, 'SystemInfo')
    ET.SubElement(sys_info, 'Version').text = '1.2'
    ET.SubElement(sys_info, 'Date').text = datetime.now().isoformat()
    
    # 相机参数
    cam_params = ET.SubElement(root, 'CameraParameters')
    for i, mtx in enumerate([params['mtx1'], params['mtx2']]):
        cam = ET.SubElement(cam_params, f'Camera{i+1}')
        ET.SubElement(cam, 'Intrinsic').text = ' '.join(map(str, mtx.flatten()))
        ET.SubElement(cam, 'Distortion').text = ' '.join(map(str, params[f'dist{i+1}'].flatten()))
    
    # 立体参数
    stereo = ET.SubElement(root, 'StereoParameters')
    ET.SubElement(stereo, 'Rotation').text = ' '.join(map(str, params['R'].flatten()))
    ET.SubElement(stereo, 'Translation').text = ' '.join(map(str, params['T'].flatten()))
    
    # 写入文件
    tree = ET.ElementTree(root)
    tree.write(filename, encoding='utf-8', xml_declaration=True)

6.2 参数验证机制

加载参数时增加完整性检查：

python复制def load_calibration_results(filename):
    try:
        tree = ET.parse(filename)
        root = tree.getroot()
        
        # 验证必需参数
        required_nodes = [
            'CameraParameters/Camera1/Intrinsic',
            'CameraParameters/Camera2/Intrinsic',
            'StereoParameters/Rotation'
        ]
        
        for path in required_nodes:
            if root.find(path) is None:
                raise ValueError(f"Missing required node: {path}")
        
        # 解析参数
        params = {}
        # ...参数解析逻辑...
        
        return params
    
    except Exception as e:
        print(f"Error loading calibration file: {str(e)}")
        return None

7. 常见问题与解决方案

7.1 标定失败排查指南

问题现象	可能原因	解决方案
无法检测棋盘格	光照条件差	增加环境亮度，避免反光
重投影误差大	标定图像不足	至少使用15-20张不同角度图像
极线对齐差	相机同步问题	使用硬件触发同步拍摄
校正后图像黑边多	相机相对旋转大	调整alpha参数保留更多有效区域

7.2 性能优化技巧

并行处理：使用多线程加速图像预处理

python复制from concurrent.futures import ThreadPoolExecutor

def batch_detect_chessboard(images):
    with ThreadPoolExecutor() as executor:
        results = list(executor.map(enhanced_find_chessboard, images))
    return results

缓存机制：存储中间计算结果

python复制import pickle

def save_intermediate_results(obj_points, img_points, filename):
    data = {
        'obj_points': obj_points,
        'img_points': img_points
    }
    with open(filename, 'wb') as f:
        pickle.dump(data, f)

GPU加速：利用OpenCV CUDA模块

python复制def gpu_rectify_images(left_img, right_img, map1x, map1y, map2x, map2y):
    gpu_left = cv2.cuda_GpuMat(left_img)
    gpu_right = cv2.cuda_GpuMat(right_img)
    
    gpu_map1x = cv2.cuda_GpuMat(map1x)
    gpu_map1y = cv2.cuda_GpuMat(map1y)
    # ...类似处理其他映射表...
    
    rect_left = cv2.cuda.remap(gpu_left, gpu_map1x, gpu_map1y, 
                              cv2.INTER_LINEAR)
    rect_right = cv2.cuda.remap(gpu_right, gpu_map2x, gpu_map2y,
                               cv2.INTER_LINEAR)
    
    return rect_left.download(), rect_right.download()

8. 实际应用案例

8.1 三维测距实现

基于标定结果实现距离测量：

python复制def calculate_distance(disparity, Q):
    """根据视差计算深度距离"""
    points_3d = cv2.reprojectImageTo3D(disparity, Q)
    z = points_3d[:,:,2]  # Z坐标即为深度
    
    # 过滤无效值
    valid_mask = (z > 0) & (z < 10000)  # 假设有效距离在10米内
    mean_distance = np.mean(z[valid_mask])
    
    return mean_distance

8.2 实时校正系统

构建实时处理流水线：

python复制def realtime_rectification(cap_left, cap_right, map1x, map1y, map2x, map2y):
    while True:
        ret_left, frame_left = cap_left.read()
        ret_right, frame_right = cap_right.read()
        
        if not (ret_left and ret_right):
            break
        
        # 执行校正
        rect_left = cv2.remap(frame_left, map1x, map1y, cv2.INTER_LINEAR)
        rect_right = cv2.remap(frame_right, map2x, map2y, cv2.INTER_LINEAR)
        
        # 显示结果
        combined = np.hstack((rect_left, rect_right))
        cv2.imshow('Rectified Views', combined)
        
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break