基于Python和CNN的猫种类识别系统设计与实现

长沮

1. 项目概述

今天想和大家分享一个基于Python和CNN的猫种类识别系统，这是我最近指导的一个本科毕业设计项目。这个项目结合了深度学习技术和Web开发，实现了从图像上传到种类识别的完整流程。对于计算机视觉入门或者想做一个综合性毕设的同学来说，这是个不错的选题方向。

这个系统主要解决了两个核心问题：一是如何准确识别不同品种的猫，二是如何将深度学习模型集成到Web应用中。项目采用了前后端分离的架构，前端使用Vue.js，后端采用Spring Boot，而核心的识别模型则是基于Python的CNN实现。整套系统从数据收集、模型训练到应用部署都包含在内，非常适合作为深度学习入门项目。

2. 系统架构设计

2.1 整体架构

系统采用B/S架构，分为三个主要层次：

前端展示层：基于Vue.js构建的用户界面，负责图像上传、结果显示等交互功能
业务逻辑层：Spring Boot实现的后端服务，处理HTTP请求、调用模型服务
数据存储层：MySQL数据库存储用户信息和识别记录

2.2 技术选型分析

2.2.1 前端技术栈

选择Vue.js主要基于以下考虑：

轻量级框架，学习曲线平缓
组件化开发模式，便于功能模块复用
丰富的生态系统（Vuex、Vue Router等）
与后端API对接方便

2.2.2 后端技术栈

Spring Boot作为后端框架的优势：

快速构建RESTful API
内置Tomcat服务器，简化部署
自动配置减少了大量样板代码
与MyBatis Plus集成良好

2.2.3 深度学习部分

CNN模型选择考虑因素：

Python生态丰富（TensorFlow/Keras/PyTorch）
CNN在图像分类任务上的成熟表现
模型可解释性相对较好
便于迁移学习

3. 核心功能实现

3.1 猫种类识别模型

3.1.1 数据集准备

我们使用了Kaggle上的公开猫品种数据集，包含12个常见品种：

波斯猫
布偶猫
英国短毛猫
暹罗猫
缅因猫
美国短毛猫
苏格兰折耳猫
俄罗斯蓝猫
孟加拉猫
埃及猫
阿比西尼亚猫
挪威森林猫

数据集处理步骤：

图像归一化（统一调整为224x224像素）
数据增强（旋转、翻转、亮度调整）
划分训练集/验证集/测试集（7:2:1比例）

3.1.2 模型构建

采用迁移学习策略，基于预训练的ResNet50模型：

python复制from tensorflow.keras.applications import ResNet50
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D
from tensorflow.keras.models import Model

base_model = ResNet50(weights='imagenet', include_top=False, input_shape=(224,224,3))

# 冻结预训练层
for layer in base_model.layers:
    layer.trainable = False

# 添加自定义层
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(1024, activation='relu')(x)
predictions = Dense(12, activation='softmax')(x)

model = Model(inputs=base_model.input, outputs=predictions)

3.1.3 模型训练

训练参数配置：

优化器：Adam（lr=0.001）
损失函数：分类交叉熵
评估指标：准确率
Batch size：32
Epochs：50

训练技巧：

使用Early Stopping防止过拟合
学习率动态调整
模型检查点保存最佳权重

最终模型在测试集上达到92.3%的准确率，满足项目需求。

3.2 Web系统集成

3.2.1 前后端交互设计

前端上传图像流程：

用户选择或拖拽图片文件
前端将图片转为Base64编码
通过Axios发送POST请求到后端API

后端处理流程：

接收Base64编码的图像数据
解码并预处理图像（尺寸调整、归一化）
调用Python模型服务进行预测
返回预测结果和置信度

3.2.2 模型服务部署

采用Flask搭建模型API服务：

python复制from flask import Flask, request, jsonify
import numpy as np
from PIL import Image
import io
import base64
from tensorflow.keras.models import load_model

app = Flask(__name__)
model = load_model('cat_breed_model.h5')

@app.route('/predict', methods=['POST'])
def predict():
    # 获取Base64编码的图像
    data = request.get_json()
    image_data = data['image'].split(",")[1]
    
    # 解码和预处理
    image = Image.open(io.BytesIO(base64.b64decode(image_data)))
    image = image.resize((224,224))
    image_array = np.array(image) / 255.0
    image_array = np.expand_dims(image_array, axis=0)
    
    # 预测
    predictions = model.predict(image_array)
    predicted_class = np.argmax(predictions[0])
    confidence = float(np.max(predictions[0]))
    
    # 返回结果
    breeds = ['波斯猫','布偶猫','英国短毛猫','暹罗猫','缅因猫',
              '美国短毛猫','苏格兰折耳猫','俄罗斯蓝猫','孟加拉猫',
              '埃及猫','阿比西尼亚猫','挪威森林猫']
    
    return jsonify({
        'breed': breeds[predicted_class],
        'confidence': confidence
    })

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000)

4. 系统功能模块

4.1 用户管理模块

实现功能：

用户注册/登录（JWT认证）
个人信息管理
识别历史记录

数据库表设计：

sql复制CREATE TABLE users (
    id INT AUTO_INCREMENT PRIMARY KEY,
    username VARCHAR(50) UNIQUE NOT NULL,
    password VARCHAR(100) NOT NULL,
    email VARCHAR(100),
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

CREATE TABLE recognition_history (
    id INT AUTO_INCREMENT PRIMARY KEY,
    user_id INT,
    image_path VARCHAR(255),
    predicted_breed VARCHAR(50),
    confidence FLOAT,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    FOREIGN KEY (user_id) REFERENCES users(id)
);

4.2 图像识别模块

核心接口设计：

POST /api/upload - 上传图像
GET /api/history - 获取识别历史
DELETE /api/history/:id - 删除记录

前端关键代码（Vue组件）：

javascript复制<template>
  <div class="upload-container">
    <input type="file" @change="handleFileUpload" accept="image/*">
    <button @click="submitImage">识别</button>
    <div v-if="result">
      <h3>识别结果: {{ result.breed }}</h3>
      <p>置信度: {{ (result.confidence * 100).toFixed(2) }}%</p>
    </div>
  </div>
</template>

<script>
export default {
  data() {
    return {
      selectedFile: null,
      result: null
    }
  },
  methods: {
    handleFileUpload(event) {
      this.selectedFile = event.target.files[0]
    },
    async submitImage() {
      if (!this.selectedFile) return
      
      const reader = new FileReader()
      reader.onload = async (e) => {
        const base64Image = e.target.result
        try {
          const response = await axios.post('/api/upload', {
            image: base64Image
          })
          this.result = response.data
        } catch (error) {
          console.error(error)
        }
      }
      reader.readAsDataURL(this.selectedFile)
    }
  }
}
</script>

5. 项目部署与测试

5.1 系统部署方案

推荐部署环境：

前端：Nginx（静态资源服务）
后端：Spring Boot Jar包（内置Tomcat）
模型服务：Gunicorn + Flask
数据库：MySQL 8.0

使用Docker编排示例：

dockerfile复制# 前端服务
FROM nginx:alpine
COPY dist /usr/share/nginx/html
COPY nginx.conf /etc/nginx/conf.d/default.conf

# 后端服务
FROM openjdk:11-jre-slim
COPY target/cat-classifier.jar /app.jar
ENTRYPOINT ["java","-jar","/app.jar"]

# 模型服务
FROM python:3.8-slim
COPY requirements.txt .
RUN pip install -r requirements.txt
COPY app.py /app/
COPY cat_breed_model.h5 /app/
WORKDIR /app
CMD ["gunicorn", "--bind", "0.0.0.0:5000", "app:app"]