大模型应用开发工程师这个岗位最近两年在技术圈里火得一塌糊涂,但真正了解它具体做什么的人并不多。简单来说,我们就是负责把那些像ChatGPT、文心一言这样的大语言模型真正用起来的人。不同于算法研究员专注于模型本身的研发,我们更关注如何让这些"大脑"在实际业务中发挥作用。
举个例子,去年我帮一家电商客户做的智能客服系统,就是基于开源大模型做的二次开发。不仅要考虑如何让模型理解商品参数、用户咨询意图,还要设计整套对话流程和异常处理机制。最终上线的系统能自动处理85%的常见咨询,这就是典型的大模型应用开发场景。
从2023年开始,各大招聘平台AI相关岗位数量同比增长超过300%。我最近帮团队招聘时深有体会:一个合格的候选人平均会收到4-5个offer竞争。头部互联网公司开出的薪资包经常比市场价高出20%-30%,就为了抢到合适的人选。
这种供需失衡主要源于:
根据我整理的2024年最新数据(样本量=2000+):
code复制| 城市级别 | 平均月薪(1-3年经验) | 资深(5年+)年薪范围 |
|----------|---------------------|-------------------|
| 一线城市 | 22K-35K | 60W-120W |
| 新一线 | 18K-28K | 40W-80W |
| 二线城市 | 12K-20K | 30W-50W |
特别要说明的是,这些数字还不包括股权激励。我认识的一位做金融风控模型的工程师,去年拿到的总包超过了200万,因为他开发的反欺诈系统帮银行减少了上亿损失。
完整的大模型应用开发需要掌握以下技能维度:
基础能力
专项技能
工程化能力
根据我带新人的经验,推荐这样的学习顺序:
重要提示:不要一开始就扎进论文里,先动手做出可运行的demo更重要。我团队最优秀的工程师都是通过实际项目快速成长起来的。
上周我的工作日志是这样的:
最近半年我们遇到的主要挑战包括:
建议选择1-2个方向深入:
需要补充的能力:
我带的几个Team Leader都是从解决具体技术问题开始,逐步承担更大责任。比如去年晋升的张经理,就是从优化一个推荐算法开始,到现在负责整个AI产品线。
根据今年参加的行业会议,重点关注:
未来3年可能出现的变化:
我建议新人现在就要选定一个深耕领域,比如金融、医疗或教育,同时保持对基础技术的持续学习。
推荐的学习资料组合:
可以尝试的实战项目:
我们面试时最看重的就是候选人是否有完整的项目经历,哪怕是很小的个人项目,只要能讲清楚技术细节和优化过程就很有说服力。
在大模型时代,持续学习能力比现有知识更重要。我每周都会留出10小时专门学习新技术,这是在这个领域保持竞争力的唯一方法。最近在研究Agent框架的开发模式,发现很多思路可以借鉴到现有项目中。技术发展太快,停下来就会被淘汰,这就是这个行业最残酷也最迷人的地方。