SuGaR 3D重建：Windows+WSL2环境配置与显存优化实战

殷迎彤

1. 项目概述

作为一名长期从事3D重建和计算机视觉研究的工程师，我最近在完成毕业设计时遇到了一个棘手的问题：如何在有限硬件条件下实现高质量的地铁隧道射流风机3D建模。经过多方调研，我选择了SuGaR（Surface-Aligned Gaussian Splatting）这一前沿技术方案，但在实际部署过程中发现官方文档存在诸多不足，特别是在Windows平台和低显存环境下的适配问题。

本文将详细介绍如何在RTX 5060（8GB显存）显卡和Windows 11 + WSL2环境下，从零开始搭建SuGaR开发环境并成功运行高斯泼溅网格提取的全过程。不同于官方文档的理想化描述，我会重点分享在实际部署中遇到的各类"坑"及其解决方案，这些经验都是我在连续72小时调试过程中积累的宝贵实战心得。

2. 硬件与系统环境准备

2.1 硬件选型考量

我选择RTX 5060（8GB显存）作为开发平台主要基于以下考虑：

性价比平衡：作为学生项目，5060在性能和价格间取得了良好平衡
显存限制挑战：8GB显存恰好是许多3D重建任务的临界点，解决这类问题具有普适参考价值
未来兼容性：50系显卡的架构特性代表了NVIDIA的最新发展方向

注意：虽然SuGaR官方推荐使用12GB以上显存显卡，但通过后文介绍的优化手段，8GB显存也能完成任务，只是需要更多耐心和技巧。

2.2 操作系统环境配置

经过多次尝试，最终确定的系统配置方案为：

宿主系统：Windows 11 22H2
虚拟环境：WSL2 + Ubuntu 22.04 LTS

选择这套组合主要基于以下技术考量：

CUDA兼容性：原生Windows环境编译CUDA算子极易出现C++编译器兼容问题
开发便利性：WSL2提供了接近原生Linux的开发体验，同时保留Windows的易用性
资源利用率：WSL2可以直接调用宿主机的GPU资源，避免虚拟机性能损失

2.2.1 WSL2安装与配置

安装WSL2的完整步骤如下（所有命令均在管理员权限的PowerShell中执行）：

bash复制# 启用WSL和虚拟机平台功能
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

# 设置WSL2为默认版本
wsl --set-default-version 2

# 安装Ubuntu 22.04
wsl --install -d Ubuntu-22.04

安装完成后需要重启系统，然后在开始菜单中打开Ubuntu终端完成初始化设置（创建用户名和密码）。

2.2.2 GPU驱动配置要点

这里有一个关键陷阱需要特别注意：

不要在WSL2内安装NVIDIA驱动
只需确保Windows宿主机的驱动是最新版本

验证驱动是否正常工作：

bash复制nvidia-smi

如果能看到GPU信息输出，说明配置正确。如果报错，请检查：

Windows是否安装了最新NVIDIA驱动
WSL2是否启用了GPU加速（在Windows"启用或关闭Windows功能"中确认)

3. 开发环境搭建

3.1 Conda环境配置

为了避免系统Python环境被污染，我们使用Miniconda创建独立环境：

bash复制# 下载并安装Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O miniconda.sh
bash miniconda.sh -b -p $HOME/miniconda
source $HOME/miniconda/bin/activate

# 创建专用环境
conda create -n sugar python=3.11 -y
conda activate sugar

3.2 PyTorch与CUDA安装

SuGaR对PyTorch版本有严格要求，经过测试，以下组合最为稳定：

bash复制conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.8 -c pytorch -c nvidia

这里有几个技术细节需要注意：

使用conda而非pip安装，可以自动解决CUDA运行时依赖
明确指定版本号避免后续兼容性问题
CUDA 11.8是目前最稳定的版本，不推荐使用更新的12.x系列

3.3 SuGaR源码获取与依赖安装

bash复制git clone https://github.com/Anttwo/SuGaR.git
cd SuGaR
pip install -r requirements.txt

安装核心算子时需要使用特殊参数：

bash复制pip install ./gaussian_splatting/submodules/diff-gaussian-rasterization --no-build-isolation
pip install ./gaussian_splatting/submodules/simple-knn --no-build-isolation

关键提示：--no-build-isolation参数至关重要，它允许构建过程访问当前环境的torch库，否则会出现"ModuleNotFoundError: No module named 'torch'"错误。

4. 源码修改与问题修复

4.1 图片路径重复后缀问题

原始代码存在一个逻辑缺陷，会在已有扩展名的文件名后再次添加扩展名。执行以下修复：

bash复制sed -i 's/ + extension//g' sugar_scene/cameras.py

这个修改移除了不必要的扩展名拼接逻辑，解决了"0001.jpg.jpg"这类错误。

4.2 PyTorch安全限制问题

新版PyTorch默认启用了权重安全校验，会导致模型加载失败。修复方法：

bash复制sed -i 's/map_location=nerfmodel.device)/map_location=nerfmodel.device, weights_only=False)/g' sugar_extractors/coarse_mesh.py

这个修改允许加载包含自定义操作的模型权重。

5. 模型训练与优化

5.1 数据集准备

SuGaR要求数据集按特定结构组织：

code复制data/
├── images/          # 所有输入图像
│   ├── 0001.jpg
│   ├── 0002.jpg
│   └── ...
└── sparse/
    └── 0/           # COLMAP生成的稀疏重建结果
        ├── cameras.bin
        ├── images.bin
        └── points3D.bin

实操技巧：使用COLMAP生成稀疏重建时，建议设置--ImageReader.single_camera 1参数确保相机参数一致性。

5.2 两阶段训练流程

第一阶段：基础3DGS训练

bash复制python gaussian_splatting/train.py -s data -m output/feji --iterations 7000

关键参数说明：

-s data：指定数据集路径
-m output/feji：模型输出目录
--iterations 7000：训练轮数（根据显存调整）

第二阶段：SuGaR表面对齐训练

bash复制python train.py -s data -c output/feji/ -i 7000 -r sdf --low_poly True

特殊参数说明：

-r sdf：启用SDF正则化，对工业物体特别重要
--low_poly True：低多边形模式，8GB显存必须开启

5.3 显存优化技巧

针对8GB显存的特殊优化：

降低训练分辨率：在配置文件中修改resolution=1
减少高斯点数量：设置--num_points 500000
使用混合精度：添加--fp16参数
分批处理：调整--batch_size为2或4

6. 网格提取与后处理

6.1 解决迭代轮数不匹配问题

由于SuGaR需要同时访问基础模型和精炼模型的检查点，可能会出现轮数不匹配错误。解决方法：

bash复制cp -r output/feji/point_cloud/iteration_7000 output/feji/point_cloud/iteration_15000

这个"移花接木"技巧创建了一个符号链接，使系统能够找到所需的参考模型。

6.2 执行网格提取

bash复制python extract_mesh.py -m ./output/coarse/data/sugarcoarse_3Dgs7000_sdfestim02_sdfnorm02/ -s data -c output/feji/ -i 15000

提取完成后，在output/coarse_mesh/data/目录下会生成多个精度的PLY文件。

6.3 结果优化建议

推荐模型：选择level03_decim200000.ply，它在细节保留和性能间取得了良好平衡
网格清理：使用MeshLab移除孤立面和噪声点
纹理优化：使用Blender的UV展开和纹理烘焙功能增强视觉效果

7. 性能监控与调试

7.1 显存使用监控

在训练过程中，可以使用以下命令实时监控显存使用：

bash复制watch -n 1 nvidia-smi

7.2 常见错误排查

CUDA out of memory：
- 降低--batch_size
- 启用--low_poly模式
- 减少--iterations次数
模型加载失败：
- 检查weights_only=False是否已设置
- 确认模型路径是否正确
训练发散：
- 调整学习率--lr
- 增加-r sdf正则化强度