从RAG到DeepSearch：AI搜索技术演进与实战解析

莫姐

1. 从RAG到DeepSearch：AI搜索技术的演进与实战解析

作为一名长期跟踪AI技术发展的从业者，我见证了检索增强生成(RAG)技术从最初的简单架构发展到如今的智能体化系统。这个演进过程不仅反映了AI模型能力的提升，更体现了我们对知识获取方式的重新思考。本文将带你深入理解这一技术脉络，并分享在实际项目中的应用心得。

2. AI搜索技术的核心挑战

2.1 模型知识的固有局限性

大型语言模型(LLM)的知识边界问题一直是我们面临的核心挑战。这种局限性主要体现在两个方面：

时效性边界：模型的训练数据存在截止日期(cut-off)，无法包含之后的新知识。比如，用2021年前数据训练的GPT-3，对新冠疫苗的最新进展就一无所知。
领域性边界：公开训练数据难以覆盖特定领域的专有知识。例如，医疗机构的电子病历、企业的内部文档等私域数据，通常不会出现在公开数据集中。

提示：在实际项目中，我们常用"知识新鲜度"指标来衡量模型知识的时效性，计算方法是对比模型回答与最新权威资料的吻合度。

2.2 传统解决方案的不足

针对这些限制，业界主要采用两种方法：

持续训练(Continuous Training)：将新数据加入训练集，通过微调更新模型权重。这种方法成本高且可能导致"灾难性遗忘"。
上下文注入(Context Injection)：在推理阶段直接将相关知识输入模型上下文。这是我们今天要重点讨论的RAG技术基础。

3. RAG技术的演进历程

3.1 基础RAG架构

最初的RAG采用简单的两阶段流程：

python复制# 伪代码展示基础RAG流程
def basic_rag(query, knowledge_base):
    # 第一阶段：检索
    retrieved_docs = retrieve(query, knowledge_base)
    
    # 第二阶段：生成
    response = generate(query, retrieved_docs)
    return response

这种架构存在明显缺陷：检索质量完全依赖原始查询的表述，当用户问题模糊或不规范时，召回效果大幅下降。

3.2 查询优化与混合检索

进阶的RAG系统引入了查询改写技术：

假设文档生成：让LLM生成可能包含答案的假设文档，用这些文档作为查询向量
上下文适应：根据对话历史调整当前查询，保持语义连贯性

同时，检索技术也从简单的向量搜索发展为：

关键词检索(BM25)
稠密向量检索(如BERT)
混合检索(结合上述两种)
知识图谱检索

在实际项目中，我们通常采用混合检索策略。以下是一个典型配置：

检索类型	权重	适用场景
关键词检索	0.3	精确术语匹配
向量检索	0.6	语义相似问题
知识图谱	0.1	实体关系查询

3.3 Agentic RAG的兴起

随着模型推理能力的提升，RAG系统开始具备自主决策能力。智能体化的RAG具有以下特征：

动态检索策略：根据上下文自主决定是否检索、检索什么
迭代式搜索：通过多轮检索逐步完善知识收集
工具集成：不仅能检索知识，还能调用计算器等工具

这种演进使得系统能够处理更复杂的查询场景。例如，当用户问"请比较BERT和GPT的优缺点"时，智能体会：

先检索两种模型的基础介绍
识别比较维度(如架构、训练方式等)
针对每个维度补充检索具体对比资料
综合所有信息生成最终回答

4. DeepSearch技术解析

4.1 核心架构

DeepSearch代表了当前最先进的AI搜索技术。以Jina AI的实现为例，其工作流程包括：

意图理解模块：分析用户问题的深层需求
知识缺口识别：判断现有知识的不足
策略规划器：制定检索和执行计划
结果综合器：整合多源信息生成最终输出

4.2 关键技术实现

实现一个基本的DeepSearch系统需要考虑以下组件：

推理引擎：使用高级LLM(如GPT-4)进行策略决策
工具集成层：
- 网络搜索API
- 专业数据库连接器
- 计算工具接口
知识管理系统：
- 短期记忆(对话历史)
- 长期记忆(知识图谱)
验证机制：对生成结果进行事实核查

以下是一个简化的工具调用示例：

python复制class DeepSearchAgent:
    def __init__(self, llm, tools):
        self.llm = llm
        self.tools = tools  # 包含检索器、计算器等
    
    def execute(self, query):
        plan = self.llm.generate_plan(query)
        results = []
        for step in plan:
            tool = self.select_tool(step)
            result = tool.execute(step)
            results.append(result)
        return self.llm.synthesize(results)