1. 大语言模型智体技能概述
2026年2月,浙江大学研究团队发表了一篇开创性论文《Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward》,系统性地阐述了大语言模型(LLM)从整体式架构向模块化、技能型智体的转变。这一转变标志着LLM在实际应用中的重大范式革新,为人工智能领域带来了全新的发展路径。
智体技能(Agent Skills)本质上是由指令、代码和资源组成的可组合包,智体可以根据任务需求动态加载这些技能包。与传统LLM将所有知识编码到模型权重中的做法不同,技能型智体通过外部技能包实现能力扩展,无需进行模型重训练。这种架构创新带来了三个显著优势:渐进式信息披露、技能定义的可移植性,以及与模型上下文协议(MCP)的无缝集成。
2. 智体技能的核心架构
2.1 SKILL.md规范与渐进式加载机制
智体技能的核心是SKILL.md规范,这是一个包含YAML元数据的Markdown文件。这种设计实现了信息的三级渐进式披露:
- 元数据层:仅包含技能名称和简短描述,智体启动时预加载这部分信息(约几十个token)
- 指令层:完整的程序指导内容,仅在技能被触发时加载
- 资源层:脚本、参考文档等辅助资源,按需动态加载
这种分级加载机制有效解决了上下文窗口有限的问题。根据Zhang等人的研究,典型技能的三级加载token消耗分别为:元数据层约50tokens,指令层约500tokens,资源层约2000tokens(视具体内容而定)。
2.2 技能执行生命周期
技能执行采用两阶段流程:
- 上下文注入阶段:将技能指令和相关资源以隐藏消息形式注入对话上下文
- 执行修改阶段:激活预先批准的工具权限,修改智体的执行环境
与传统的函数调用不同,技能执行不直接产生结果,而是重塑智体的认知和执行能力。这种机制使得智体能够更灵活地适应各种专业场景。
2.3 模型上下文协议(MCP)集成
MCP作为智体技术栈的另一个关键组件,于2024年11月发布,2025年12月捐赠给Linux基金会的智体人工智能基金会。MCP通过JSON-RPC 2.0协议实现智体与外部系统的连接,提供三种核心原语:
- 工具(Tool):模型可调用的函数
- 资源(Resource):应用程序控制的数据
- 提示(Prompt):用户调用的模板
技能与MCP形成互补关系:技能提供"做什么"的程序知识,MCP提供"如何连接"的基础设施。例如,一个PDF处理技能可能指示智体使用特定的MCP服务器来访问文档处理API。
3. 智体技能的获取方式
3.1 人工编写技能
最直接的技能创建方式是人工编写。Anthropic的框架使这一过程变得简单——一个基础技能可以仅由一个包含几十行指令的Markdown文件构成。Claude Code中的"技能创建元技能"能够根据自然语言描述自动生成技能框架,包括目录结构、SKILL.md文件和配套脚本。
企业级应用方面,Atlassian、Canva等公司已经开发了用于编码专有工作流程的生产级技能。2025年12月推出的合作伙伴目录建立了类似应用商店的审核流程,但准入门槛更低,因为技能本质上是结构化文档而非可执行程序。
3.2 基于强化学习的技能获取
SAGE(技能增强型GRPO自进化)框架代表了通过强化学习获取技能的先进方法。其核心创新在于:
- 顺序部署策略:智体在一系列相关任务上训练,保留并重用先前任务中生成的技能
- 技能集成奖励机制:除任务结果外,额外奖励高质量、可重用的技能创建
在AppWorld测试中,SAGE实现了72.0%的任务目标完成率,相比无技能库的基线提升8.9%,同时减少26%的交互步骤和59%的生成token。这种效率提升对降低运营成本尤为重要。
3.3 自主技能发现
SEAgent框架专注于解决自主技能发现的挑战。其创新点包括:
- 世界状态模型:评估技能发展轨迹
- 课程生成器:从软件指南内存中生成渐进复杂的任务
- 专家到通才的训练策略:整合领域专长
在OSWorld的五个新软件环境中,SEAgent将成功率从11.3%提升至34.5%,比UI-TARS基线提高23.2个百分点。
3.4 结构化技能库与组合式合成
CUA-Skill采用知识工程方法,将人类计算机使用经验编码为:
- 参数化的执行图
- 组合图
- 类型化参数和前提条件
在WindowsAgentArena平台上,该方法达到57.5%的成功率。另一方面,Agent Proposing技术证明技能可以动态组合——300亿参数求解器在AIME 2025数学竞赛中取得91.6%的成绩。
4. 计算机使用智体(CUA)的实现
4.1 GUI智体架构进展
CUA已成为技能范式的主要应用领域,因其通过GUI操作计算机的需求天然契合技能抽象。关键进展包括:
- UI-TARS(2025.1):通过增强感知和系统2推理建立新基准
- UI-TARS-2:引入数据飞轮,在OSWorld和AndroidWorld分别达到47.5%和73.3%准确率
- Agent S2:混合定位机制,性能比Claude Computer Use提高18.9%
- OpenCUA:最全面的开源框架,涵盖3个操作系统和200+应用程序
4.2 GUI定位技术突破
精确的GUI元素定位仍是CUA的关键挑战。重要进展有:
- UGround(ICLR 2025):基于130万张截图的1000万GUI元素训练,性能提升20%
- Jedi框架:通过UI分解将OSWorld成功率从5%提升至27%
- Yuan的RL方法:70亿参数模型在ScreenSpot-Pro测试中达到47.3%成功率
- GUI-Actor:无坐标视觉定位,7B模型超越UI-TARS-72B
4.3 基准测试现状
当前CUA基准测试显示显著进步:OSWorld测试成功率从2024年初的个位数攀升至2025年12月的72.6%(接近人类72.36%基线)。然而,在专业应用、长周期任务和混合GUI-代码工作流等复杂场景中,性能差距仍然明显。
5. 智体技能的安全挑战与治理
5.1 安全威胁实证研究
三项同期研究(2025.10-2026.2)揭示了智体技能的新型安全威胁:
- Schmotz证明"极其简单"的提示注入攻击
- Liu的大规模分析(42,447个技能)显示26.1%存在漏洞
- 确认98,380个技能中存在157个恶意样本
具体漏洞类型包括:
- 提示注入(13.3%)
- 数据泄露(11.8%)
- 权限提升
- 供应链风险
5.2 技能信任与生命周期治理框架
为解决安全问题,研究提出四层治理框架:
-
验证门:
- G1:静态分析(模式匹配、依赖扫描)
- G2:LLM语义分类检测意图不匹配
- G3:行为沙箱执行
- G4:权限清单验证
-
信任层级:
- T1:社区技能(仅指令访问)
- T2:基础信任技能
- T3:高信任技能
- T4:厂商认证技能(全功能)
-
生命周期管理:
- 持续运行时监控
- 异常行为触发降级
- 良好记录可升级
该框架特别设计为与三级渐进式披露架构对应,确保治理决策基于实际攻击面。
6. 未来研究方向与挑战
6.1 跨平台可移植性
当前为特定平台(如Claude)编写的技能可能隐式依赖平台特有功能。解决方案方向:
- 通用技能运行时
- 跨平台技能编译
6.2 大规模技能选择
Li发现技能选择准确性随库规模增长会出现相变。高级工具搜索部分解决问题,但根本性的扩展挑战仍存。
6.3 技能组合与编排
需要发展的方向:
- 多技能编排原则框架
- 冲突解决机制
- 资源共享方案
- 故障恢复策略
6.4 基于能力的权限模型
当前隐式信任模型易受攻击。改进方向:
- 技能声明所需权限
- 显式授权机制
- 最小权限原则实施
6.5 技能验证与测试
缺乏标准化测试框架。需要发展:
- 自动技能验证技术
- 特定于技能的测试工具
- 形式化方法应用
6.6 持续学习不遗忘
关键问题:
- 新技能获取如何不影响现有能力
- 自蒸馏等技术应用
- 动态加载技能的交互影响
6.7 评估方法创新
需超越任务完成率的指标:
- 技能可重用性
- 可组合性
- 可维护性
- 环境变化鲁棒性
7. 实操建议与经验分享
在实际应用中部署智体技能时,有几个关键经验值得分享:
-
技能设计原则:
- 单一职责:每个技能应专注于解决特定类型的问题
- 明确接口:定义清晰的输入输出规范
- 适度粒度:平衡特异性和通用性
-
安全实践:
- 实施四层验证门控
- 采用最小权限原则
- 建立技能来源可信度评估机制
-
性能优化:
- 控制技能元数据大小(约50tokens)
- 延迟加载非核心资源
- 使用技能缓存机制
-
团队协作:
- 建立技能版本控制系统
- 实施同行评审流程
- 维护技能文档标准
-
监控与维护:
- 跟踪技能使用频率和成功率
- 建立技能淘汰机制
- 定期审查技能权限设置
从实际部署经验来看,成功的智体技能系统往往遵循"简单到复杂"的演进路径。建议从少量高价值技能开始,逐步扩展库规模和复杂度。同时,投资于技能发现和组合的基础设施,这对长期可维护性至关重要。