最近一年来,企业AI领域出现了一个令人深思的现象:大量投入使用的数据Agent在实际业务场景中表现不佳,甚至完全无法达到预期效果。a16z最新发布的《Your Data Agents Need Context》一文直指问题核心——这些Agent并非因为模型能力不足而失败,而是因为它们缺乏对企业业务上下文的深入理解。
OpenAI内部数据显示,他们为3500多名员工服务的600PB数据Agent系统,在早期版本中也遭遇了同样的困境。MIT 2025年度报告更是揭示了一个惊人的数据:95%的企业级生成式AI项目失败的主要原因正是"缺乏上下文学习能力"。这个发现让整个行业开始重新思考数据Agent的设计理念。
过去十年间,企业数据架构经历了从传统数据仓库到数据湖,再到Lakehouse的演进。dbt、Snowflake、Databricks等工具的出现,让数据整理和SQL查询变得前所未有的便捷。这种进步让我们产生了一种错觉:只要数据整理好了,任何分析需求都能轻松满足。
然而,当LLM技术爆发式发展后,企业纷纷尝试将"Chat with your data"的概念落地时,现实给了我们当头一棒。一个看似简单的业务问题——"上季度收入增长多少?"——就足以让大多数数据Agent陷入困境。这不是因为模型不理解自然语言,而是因为Agent缺乏对企业特定业务定义的认知。
在实际业务场景中,上下文缺失主要体现在三个关键维度:
业务定义模糊:不同部门对"收入"的定义可能完全不同——是run-rate还是ARR?是否包含新产品线?财季如何对齐?这些定义往往分散在各种文档、邮件甚至离职员工的头脑中。
数据源混乱:同一指标可能存在于财务系统的fct_revenue表、数据团队的mv_revenue_monthly视图以及CRM系统的自定义报表中,而Agent无法判断哪个是权威数据源。
隐性知识缺失:企业中存在大量"部落知识",比如"2025年后美国新单看Affinity,老全球lead还用Salesforce"这样的业务规则,这些从未被正式记录的信息对Agent来说完全是盲区。
传统Semantic Layer(如LookML、MetricFlow)只能解决指标定义的问题,而现代数据Agent需要的是一个更全面的"上下文层"。这个新概念正在被不同厂商以各种名称推广——Context Layer、Context OS、Context Graph、Ontology等,但其核心功能是一致的:将企业所有隐性知识显性化、结构化,并实时提供给Agent使用。
| 维度 | 传统Semantic Layer | 现代Context Layer |
|---|---|---|
| 核心功能 | 指标定义(revenue = …) | 业务全貌(谁、什么、为什么、怎么变) |
| 更新方式 | 数据团队手动维护 | 自动化+人工精炼+自更新 |
| 覆盖范围 | 结构化BI指标 | +部落知识、决策逻辑、非结构化数据 |
| Agent友好度 | 只能查数 | 能自主推理、规划、纠错 |
本质上,Semantic Layer是为BI工具准备的静态字典,而Context Layer则是为数据Agent打造的动态企业大脑。它不仅包含指标定义,还涵盖了实体关系、身份解析、治理规则、决策流程和历史变更等全方位上下文信息。
OpenAI内部数据Agent的成功实践为我们提供了极有价值的参考。他们的系统构建了六层上下文架构:
这种架构使得OpenAI的数据Agent从"需要180行SQL还不敢确定是否正确"的状态,进化到"自然语言一问就能得到精准答案"的水平。值得注意的是,OpenAI团队发现,优化这六层上下文带来的效果提升,远大于单纯升级模型带来的改善。
根据a16z、OpenAI以及多家领先企业的实践经验,构建有效的Context Layer可以遵循以下五个关键步骤:
提示:现代数据栈工具(如dbt、Airflow)已经内置了部分元数据管理功能,可以作为起点。
技术实现上,可以结合以下工具:
这一阶段产出物通常包括:
实现技术上可以考虑:
Palantir Ontology:
Atlan Active Metadata:
Graphlit Knowledge Graph:
对于预算有限或需要高度定制的团队,可以考虑以下开源方案:
| 组件 | 推荐工具 | 主要功能 |
|---|---|---|
| 元数据管理 | DataHub/Amundsen | 元数据采集和发现 |
| 知识图谱 | Neo4j/JanusGraph | 实体关系建模 |
| 文档处理 | Haystack/LlamaIndex | 非结构化数据处理 |
| 规则引擎 | Drools | 业务规则执行 |
| 向量存储 | Weaviate/Milvus | 上下文语义检索 |
| 方案 | 优势 | 适用场景 | 成本 |
|---|---|---|---|
| Databricks Genie | 与Delta Lake深度集成 | 已用Databricks的企业 | 高 |
| Snowflake Cortex | 无需数据移动 | Snowflake现有客户 | 中高 |
| Glean Search | 企业搜索起家,UI优秀 | 非技术用户为主 | 中 |
组织阻力:
技术债务:
规模化管理:
版本控制:
访问审计:
质量监控:
分层存储:
预计算:
分布式处理:
传统数据团队需要培养的新能力:
上下文工程:
LLM应用开发:
数据治理扩展:
| 阶段 | 目标 | 持续时间 | 关键产出 |
|---|
| 维度 | 指标 | 测量方法 |
|---|---|---|
| 效率 | 平均问题解决时间 | 工单系统分析 |
| 质量 | 回答准确率 | 人工抽样评估 |
| 覆盖 | 业务域覆盖率 | 上下文目录审计 |
| 成本 | 人力投入节省 | 运维工时统计 |
Context Layer技术仍处于快速发展阶段,以下几个方向值得特别关注:
动态上下文感知:
跨企业上下文交换:
认知架构创新:
在实际操作中,建议团队从一个小而重要的业务领域开始,比如收入分析或客户分群,构建第一个Context Layer原型。通过迭代式开发,逐步扩展覆盖范围和完善功能。记住,完美的上下文覆盖不如及时可用的部分覆盖——关键在于建立一个能够持续学习和改进的活系统。