基于LSTM的古诗词自动生成系统设计与实现

Fesgrome

1. 项目概述

这个基于LSTM的古诗词自动生成系统是一个结合了深度学习技术和传统文学创作的创新项目。作为一名长期从事AI应用开发的工程师，我发现将现代机器学习算法应用于传统文化领域，能够产生许多令人惊喜的化学反应。

LSTM（长短期记忆网络）作为RNN的改进版本，特别适合处理像古诗词这样具有时序性和上下文依赖关系的文本数据。与传统的规则匹配或统计方法相比，LSTM能够更好地捕捉古诗词的韵律、意境和创作规律。

这个系统不仅实现了后端LSTM模型的训练和预测功能，还通过Spring Boot+Vue的全栈架构，构建了一个完整的Web应用，让用户能够直观地体验AI作诗的乐趣。对于计算机专业的学生来说，这是一个非常好的课程设计或毕业设计选题，因为它涵盖了：

深度学习模型构建
自然语言处理技术
全栈Web开发
系统设计与实现

2. 核心算法设计

2.1 LSTM模型选型

在文本生成任务中，我们对比了几种常见的神经网络结构：

普通RNN：容易出现梯度消失问题，难以捕捉长期依赖
GRU：计算效率高但记忆能力稍弱
Transformer：需要大量数据和计算资源

最终选择LSTM是因为：

特有的门控机制能有效解决梯度消失问题
记忆单元设计适合处理古诗词的长距离依赖
相比Transformer更节省计算资源

模型结构设计如下：

python复制model = Sequential()
model.add(Embedding(vocab_size, embedding_dim, input_length=max_len-1))
model.add(LSTM(256, return_sequences=True))
model.add(Dropout(0.2))
model.add(LSTM(128))
model.add(Dense(vocab_size, activation='softmax'))

2.2 数据预处理关键步骤

高质量的数据预处理对模型效果至关重要：

语料收集：从《全唐诗》等权威来源获取5万余首古诗
文本清洗：
- 去除标点符号和现代文注释
- 统一繁体字转简体字
- 按诗句分行处理
分词处理：采用基于规则的特殊分词方法：

python复制def poem_segment(text):
    # 七言诗按2/2/3分，五言诗按2/3分
    if len(text) == 7:
        return [text[:2], text[2:4], text[4:]]
    elif len(text) == 5:
        return [text[:2], text[2:]]

向量化处理：
- 构建字符到ID的映射表
- 使用one-hot编码
- 序列填充到统一长度

实际处理中发现，传统中文分词工具对古诗效果不佳，自定义规则分词反而能更好保留诗歌韵律特征。

3. 模型训练与优化

3.1 训练参数设置

经过多次实验，最终确定的超参数组合：

参数	值	选择理由
迭代次数	100	验证集loss开始平稳
Batch Size	64	兼顾训练效率和内存占用
学习率	0.001	使用Adam优化器时的推荐值
Embedding维度	128	平衡表达能力和计算成本
Dropout率	0.2	有效防止过拟合

训练过程中的关键技巧：

使用Early Stopping防止过拟合
采用学习率衰减策略
每轮保存最佳模型权重

3.2 效果评估方法

不同于常规分类任务，诗歌生成质量评估更具主观性。我们设计了多维评估方案：

自动评估指标：
- 困惑度(Perplexity)
- 韵律匹配度
- 重复率
人工评估：
- 邀请中文系教授评估
- 从"意境"、"格律"、"创新性"三个维度打分
- 与其他生成方法对比测试
用户测试：
- 收集100名用户的反馈
- 满意度调查问卷

评估结果显示，我们的模型在保持合理格律的同时，生成的诗歌在意境和创新性上明显优于基于规则的生成系统。

4. 系统实现细节

4.1 技术架构设计

系统采用前后端分离的架构：

前端：

Vue.js框架
Element UI组件库
Axios处理HTTP请求
响应式布局适配多终端

后端：

Spring Boot 2.7
MyBatis Plus数据访问
Redis缓存生成的诗歌
线程池处理并发请求

数据库：

MySQL 8.0存储用户数据和诗歌记录
设计遵循第三范式
建立适当的索引优化查询

4.2 核心功能实现

诗歌生成API：

java复制@PostMapping("/generate")
public ResponseResult generatePoem(
    @RequestParam String prompt,
    @RequestParam(defaultValue = "5") int length,
    @RequestParam(defaultValue = "0.7") double temperature) {
    
    // 调用Python模型服务
    String poem = pythonService.generatePoem(prompt, length, temperature);
    
    // 保存生成记录
    PoemRecord record = new PoemRecord();
    record.setContent(poem);
    record.setUserId(SecurityUtils.getUserId());
    poemMapper.insert(record);
    
    return ResponseResult.success(poem);
}