去年开始,我发现一个有趣的现象:单靠ChatGPT生成的小红书笔记,点赞量始终徘徊在两位数。不是AI不够聪明,而是它缺少了真实创作者的工作流程——没有头脑风暴的碰撞,没有反复修改的打磨,更没有对平台调性的深度理解。于是我尝试用CrewAI搭建了一个由4个AI角色组成的"内容工作室",结果第一篇关于东京咖啡店的笔记就突破了5000赞。
这个系统的核心思路很简单:把内容创作拆解成标准化的生产流水线,每个环节由专门的AI角色负责。就像真正的MCN机构里,策划、文案、视觉、运营各司其职。当AI们开始像人类团队一样协作时,产出的内容突然就有了"人味"。
关键突破点:用多智能体分工模拟真实创作流程,比单一大模型输出效果提升显著。实测同一主题下,CrewAI生成内容比直接GPT-4生成的平均互动量高出3-7倍。
这套系统的四个AI角色设计,来源于对100篇小红书爆款笔记的反向工程。每篇高互动内容都暗含以下要素:
创意总监(Brainstormer)
负责解决"选题痛点"。通过分析平台热搜词和竞品数据,生成3-5个具备病毒传播潜力的标题方向。其prompt设计特别强调"情绪钩子"(如焦虑、好奇、向往)和"实用价值"(如清单、攻略、测评)的结合。
主笔作者(Writer)
模拟真人写作的"非对称性"——专业内容要用口语表达。它的backstory里埋入了关键限制:"拒绝教科书式陈述,必须包含至少一个生活场景细节"。这正是消除AI味的核心技巧。
爆款优化师(Optimizer)
相当于内容"算法工程师"。其知识库包含两类关键数据:
配图策划师(Visual Prompt)
解决图文匹配度问题。研究发现,小红书算法会给图片与文案高度契合的笔记更高权重。这个角色专门学习过平台热门笔记的视觉风格,能生成包含"日系胶片感""高饱和美食""ins风留白"等平台偏好元素的prompt。
整个工作流采用严格的串行架构,每个环节的输出都是下个环节的输入。这种设计模拟了专业内容团队的三审三校流程:
code复制主题输入 → 创意脑暴 → 文案撰写 → 优化审核 → 视觉匹配
特别值得注意的是optimizer的任务设计。它不仅要优化表达,还要执行"AI味检测"——通过以下维度打分:
虽然示例中使用的是OpenAI API,但实测国内可用的替代方案效果也不错:
bash复制# 使用通义千问作为LLM基础
pip install dashscope
python复制from langchain_community.llms import Tongyi
llm = Tongyi(model_name="qwen-max", temperature=0.7)
对于需要本地部署的场景,推荐用Ollama+Qwen2.5 14B模型:
bash复制ollama pull qwen2.5:14b
python复制from langchain_community.llms import Ollama
llm = Ollama(model="qwen2.5:14b")
temperature参数的设定需要分角色调整:
任务超时控制是稳定性的关键。建议为每个task添加timeout参数:
python复制task1 = Task(
description="...",
expected_output="...",
agent=brainstormer,
timeout=300 # 5分钟超时
)
以系统生成的"东京咖啡店"笔记为例,其成功要素可归纳为:
标题结构
年份+地点+数量词+情感价值+冲突点
"2026东京最治愈的5家隐藏咖啡店|下班后只想躲在这里(别再被涩谷人挤了!)"
正文节奏
采用"痛点场景→解决方案→个人背书→行动号召"的四段式:
markdown复制[痛点] 东京的冬天好冷...
[解决] 这5家店有暖炉+特调...
[故事] 店主老爷爷会送手写明信片...
[引导] 你们还知道哪些宝藏小店?
视觉策略
生成的配图prompt包含三个层次:
问题1:产出内容过于模板化
解决方案:
问题2:配图与文案关联弱
解决方案:
问题3:优化后失去重点
解决方案:
这套框架经过简单改造就能适配其他内容平台:
公众号长文模式
短视频脚本创作
电商产品文案
最近我正在试验更复杂的多轮迭代流程——让optimizer和writer进行3-5轮攻防修改,同时加入用户画像作为输入条件。一个令人惊喜的发现是:当系统知道目标读者是"25-30岁一线城市女性"时,会自动增加"通勤友好""宠物友好"等标签化描述。