从Prompt到Skills：AI认知模型的进化与实践

诚哥馨姐

1. 为什么我们需要Skills？从Prompt到认知模型的进化

最近在AI应用开发领域，Skills这个概念突然火了起来。作为一个从早期Prompt Engineering一路踩坑过来的开发者，我深刻理解传统Prompt方法在复杂场景下的局限性。Skills不是简单的Prompt模块化，而是一种全新的AI认知框架。

记得去年做一个电商客服自动化项目时，我们给AI写了上百条Prompt来处理各种用户咨询。但当遇到"我昨天买的衣服不合适，但已经剪了吊牌还能退吗"这种复合型问题时，AI就开始胡言乱语。这正是传统Prompt方法的死穴——它缺乏对问题本质的认知能力。

1.1 Prompt方法的三大困境

困境一：工具依赖症
在MCP（模块化调用Prompt）模式下，我们给AI一堆工具函数：查询订单()、查询退货政策()、发起退货流程()。就像给厨师一堆厨具却不教他做菜逻辑，AI只会机械地调用工具，遇到工具覆盖不到的情况就束手无策。

困境二：指令盲区
普通Prompt像是给AI一本操作手册。比如：

code复制如果是尺寸问题：1. 询问具体尺寸 2. 提供退换货选项
如果是质量问题：1. 要求拍照举证 2. 建议退款

但当用户同时提出"尺寸不对而且面料起球"时，AI就陷入混乱。因为手册里没写这种情况该怎么处理。

困境三：认知断层
最致命的是，传统方法缺少元认知层。AI不知道"我是谁"（客服助手）、"我的核心价值是什么"（快速解决用户问题）、"我的边界在哪里"（不能承诺超出政策的内容）。就像一个没有职业素养的客服，每次对话都从零开始。

2. Skills架构解析：构建AI的认知操作系统

2.1 元认知层：AI的"身份证"

在我开发的客服Skill中，元认知层是这样定义的：

python复制{
    "identity": "电商售后专家",
    "core_value": [
        "快速定位问题本质",
        "在政策框架内最大化用户满意度",
        "保持专业且友善的沟通风格"
    ],
    "boundaries": [
        "不承诺政策外的解决方案",
        "不猜测未确认的产品缺陷",
        "不代替用户做最终决定"
    ]
}

这相当于给AI安装了"职业素养"。实测发现，有了元认知的AI，在面对情绪化用户时（比如"你们这破衣服害我约会出丑！"），回复明显更专业得体。

2.2 决策逻辑显式化：从if-else到决策树

传统Prompt的决策逻辑是隐藏在自然语言中的，比如：

code复制如果用户要退货：1. 确认订单号 2. 询问原因...

而Skill会显式构建决策图谱：

mermaid复制graph TD
    A[用户提出退货] --> B{是否在7天内?}
    B -->|是| C[走标准退货流程]
    B -->|否| D{是否有质量问题?}
    D -->|是| E[特殊退货通道]
    D -->|否| F[建议换货或补偿券]

这种结构化表达让AI的决策过程变得透明可控。在我的项目中，售后问题的首次解决率从58%提升到了82%。

2.3 问题解决螺旋：AI的"经验值"系统

真正的突破在于问题解决螺旋机制。我们设计了这样的学习循环：

code复制尝试标准退货流程 
→ 用户反馈"已剪吊牌" 
→ 触发异常处理 
→ 发现可走"商品缺陷"通道 
→ 更新决策树

这个过程中，AI会积累"行业经验"。比如发现"剪吊牌但保留水洗标"仍可退货，就把这个判断条件加入知识库。这就像人类客服的成长过程。

3. Skills实战：从零构建浏览器自动化Skill

3.1 定义元认知层

yaml复制name: "BrowserAutomationExpert"
purpose: "在复杂Web环境中可靠执行操作并生成文档"
core_principles:
  - "稳定性优于速度"
  - "每个操作必须有验证机制"
  - "遇到障碍立即切换策略"
limits:
  - "不重复失败的操作超过2次"
  - "不生成模糊的截图说明"

3.2 构建决策矩阵

将隐性的浏览器操作经验转化为显式规则：

场景	首选方案	备选方案	验证方式
常规点击	browser_click	browser_evaluate+JS	元素状态检测
下拉选择	mousedown+click	直接设置select值	选项selected属性
文件上传	模拟input事件	直接设置files属性	文件列表校验

3.3 实现问题解决螺旋

以处理Ant Design下拉框为例：

首次尝试browser_click失败（被遮挡）
自动触发诊断：
- 检查元素是否可见
- 检测是否有pointer-events限制

切换到组合事件策略：

javascript复制await page.evaluate((selector) => {
  const el = document.querySelector(selector);
  el.dispatchEvent(new MouseEvent('mousedown'));
  el.dispatchEvent(new MouseEvent('click'));
}, selector);