AI 大模型岗位求职全攻略
姚堃、Leo、凌智

第一环节:对话资深猎头 York
本轮的访谈嘉宾是来自 TTC 的姚堃(York)老师,他是知名猎头公司 TTC AI 交付中心负责人
专注 AI 行业的人才搜寻,服务过 100+ AI 企业,包括互联网大厂和众多创业公司,熟悉 AI 领域人才地图,有深度陪伴创始人从 0-1 搭建产研团队经验。在技术人员招聘求职领域有丰富经验,可以帮助程序员在 AI 浪潮下实现转型和职业提升。
Q1:从猎头的角度来看,2025 年 AI 大模型人才的招聘市场,是更卷了还是需求更大了?主要的需求来自于哪些类型的公司?
York:根据我的观察,目前的 AI 大模型人才市场既“卷”又“热”。
如何理解“卷”和“热”呢?如果你仍在传统方向,比如挤进大厂做 Java 工程师,那确实很“卷”,因为这些属于上一个时代的事情。但如果你投身于 AI 大模型、AI 应用等朝阳赛道,那么市场需求非常热。目前我服务的几十家甚至上百家公司都在招聘 AI 大模型和应用相关人才,根本招不完。
我服务的大部分公司是一些明星创业公司,他们在前后端、产品、算法等方向都有大量需求。这类公司对人才求贤若渴,希望候选人尽快入职。至于哪些公司招聘更多 AI 人才,实际上各类公司都在招,但方向和团队可能不同。大厂的传统主营业务已趋于稳定,招聘较少,但其 AI 业务仍在持续大量招人。
与以往不同的是,近一两年创业公司的招聘需求特别大。为什么?因为在 2022、2023 年,AI 创业机会有限,移动互联网行业已进入后期。但近两年,大模型和 AI 应用为市场带来了新一轮创业春天,许多来自大厂或 AI 明星企业的员工纷纷创业成立新公司。因此,如果今年推荐大家找工作,创业公司是一个很好的方向,需求特别多。总结来说,招聘市场又“卷”又“热”,最热的是 AI 新业务的大厂开发岗位和 AI 创业公司。
Q2:市面上有哪些热门的 AI 大模型岗位?算法和工程类的岗位哪个需求更大一些?不同岗位对教育背景、工作背景的要求有哪些区别?
York:当前市场上的热门岗位主要与 AI 相关。只要与 AI 挂钩的岗位,需求都非常旺盛,无论是算法还是工程。传统算法和工程岗位不多,但 AI 大模型应用算法、AI 工程、AI 全栈、AI 产品、AI 运营等带“AI”标签的需求很多。
算法和工程岗位的需求多少取决于阶段和公司类型。前两年,大模型公司以算法岗位为主,因为他们需要开发模型,进行预训练、后训练等,这类岗位特别多。搜索、广告、推荐等传统算法岗位较少。今年进入 AI 应用年,工程岗位需求增加,前后端、全栈等工程岗位成为刚需。
二是看产品开发阶段。去年做大模型,算法岗位多;今年做 AI 应用,工程岗位多;产品开发完成后,增长和运营岗位会增加;用户增长后,商业化岗位会增多。如果能紧跟潮流,从工程转向增长相关工程,就能一直处于热门方向。
对于教育背景和工作背景的要求,算法岗位特别看重背景,通常需要博士学历,且来自好学校,有顶刊论文发表。工程岗位对背景要求不高,学历不如以前重要,更看重对领域的理解和 AI 应用经验。只要做过相关项目,无论出身,都能获得机会。因此,算法看重背景,工程看重应用经验。
Q3:能否透露一下目前不同规模公司以及不同级别岗位 AI 大模型人才的薪资范围,有哪些因素能显著影响到薪资包?
York:还是拆开算法和工程类岗位说,先说算法,算法是一个上限下限范围非常大的岗位,顶级的算法人才薪资是没有上限的,薪资因人而异,顶级人才薪资极高。
工程岗位的薪资标准化程度较高。初级工程师月薪通常在 2-3 万,年薪约 30-50 万。中级工程师(5-8 年经验)月薪在 3-5 万,年薪 50-80 万。高级工程师或小组长月薪 5 万以上,加上期权,年薪可达百万。更高级别如大型团队组长或 CTO,年薪可达 100 万、200 万甚至 300 万,没有上限。
影响薪资的因素方面,算法岗位取决于学历背景(如清华、麻省理工、哈佛的博士)、顶级论文及顶级项目经验(如 OpenAI)。工程岗位更看重应用经验,学历背景影响较小。如果在大模型公司有成功的 AI 应用产品经验,或在顶级 AI Agent 公司有实践认知,会非常抢手,容易获得多个 Offer。
Q4:对于传统技术岗转型 AI 大模型,老师有什么建议?
York:当前 AI 行业不必羡慕背景特别好的人,他们属于顶尖人才,全球也没几个。AI 时代的到来给了大家弯道超车的机会,就像创业一样,以前大厂已经稳固,创业机会少,但 AI 时代带来了新机会。对程序员来说也是如此。
在行业稳定时,公司看重学历、背景,挑选最好的人。但在新兴行业如 AI,招聘标准完全不同。以前技术岗位看重学历、公司、核心业务和职业稳定性,现在 AI 时代更关注项目经验。如果近两年积累了 AI 项目经验,会非常吃香。例如,去年开始做 Agent,今年遇到 Agent 元年,这类经验非常宝贵,非常抢手。
从方法论角度,建议大家向 AI 方向转型,因为继续做传统方向实在是太卷了,很大可能会被会用 AI 的人淘汰。如何转型?首先,每个人背景不同,需找出可迁移的能力。例如,做电商的可以关 注 AI 电商相关机会;做前端的可以用 AI 写后端代码,成为全栈。如果没有 AI 项目经验,可以在开源社区或业余时间做 AI 相关项目,这些都是较好的转型方式。关键是要用控制变量法。不要同时换行业、公司、岗位和老板,失败率很高。跳槽时,每次只换一点,逐步转向目标方向。例如,公司内部有 AI 项目,可以转组到 AI 团队;或跳槽时保持岗位不变,但加入 AI 公司。这样逐步转型,成功率更高。
选择公司时,需根据自身情况决定。大体上,如果你追求稳定,做好一份工作,没有太大野心,不想承担风险,大厂可能更适合。大厂规模大,岗位较螺丝钉化,按部就班工作,薪酬通常比创业公司高,平台好,体面。如果你有野心,受不了大厂的螺丝钉生活,不想应对向上管理和 PUA,想以 CEO 心态工作,可以加入创业公司。
不一定自己创业,创业是大佬的游戏,自己创业难度大,但加入创业公司可以主动承担更多责任,弹性较大,想法能快速落实。灵活、有野心的同学此时加入创业公司是较好的选择。此外,AI 时代跨行业牵引能力大大增强。以前从电商转内容很难,但现在利用 AI 工具快速学习,转型成本降低。你可以转向感兴趣的行业,例如从金融转教育,只要用好 AI 快速学习,就能很快转型。也可以选择兴趣导向的工作,因为兴趣带来热情,能做得更好。
Q5:典型的大厂 AI 技术岗位面试有哪些流程?通常有几轮面试?每轮重点考察哪些方面?
York:大厂面试流程每家公司不同,但通常在 3-5 轮之间。常见流程包括:第一轮是直属领导面,第二轮是技术面,第三轮是交叉面,之后是大老板面,最后是 HR 面。每轮面试时,如果是猎头推荐,一定要问清楚面试官是谁,这一点很重要。
面试的核心是通过,因此需针对性准备。例如,聊过往经历和工作内容每轮都可能涉及,但薪资可能只有直属领导或 HR 能谈,甚至有些公司连直属领导都不能知道薪资,那时就不要聊。每轮面试前先问清楚面试官身份,知己知彼最重要。
HR 面不关心项目经验,只要前面的人认为你可以,HR 主要关心薪酬能否谈下来以及稳定性。直属领导关心文化匹配度和团队融合,CEO 也关心文化匹配度,交叉面试官则不关心文化匹配度。每轮面试都有特点,需抓住核心点,针对性准备和回答。
Q6:在具体面试环节中,候选人常犯哪些错误?该如何避免?
York:我们经常处理这类事情,需要培训人选什么该说、什么不该说。首先,面试时不能以产品经理视角,而要以用户视角面试。目的不是真实表达所有想法,而是照顾对方感受,关心他到底想问什么。例如,当问薪资时,如实回答即可;问离职原因时,需思考他为什么问,可能是关心稳定性,那就证明稳定性好。
不要字面回答,而要思考问题背后的出发点,基于出发点回答,通过率会大大提高。总结第一个观点:以用户视角思考问题,而不是产品视角。第二个观点:面试是互动过程,不要单方面输出。常见雷点是自我介绍 10 分钟,面试官早已不想听,只想开始提问。应框架性介绍工作内容、待过哪些公司、做过哪些类型事情,三句话总结,3 分钟介绍完,然后互动问答。
互动时遵循第一条,以用户视角解决问题,知道对方关心什么,聊得愉快。而不是对方不想听还在不停回答。因此,一定要互动,不要单方面输出,根据对方关心宏观或细节问题相应回答。
Q7:很多同学关心薪酬谈判的话题,老师能讲讲如何优雅谈薪吗?
York:想在薪资上有竞争力,首先需了解市场行情,知道自己在市场上值多少钱,去哪些公司范围如何。不要盲目要求涨 30%、50%,现在行情没那么好,好公司多是创业公司,期权较多,难涨很多钱。了解市场后,如果有猎头推荐,最好打听给多少钱合适;如果没有,自己报一个区间,如涨 10%~20%,别说死具体数字,留谈判空间。
谈判时不要陷入必须涨 ¥5000、¥3000 的低效沟通。最好先强调自己的价值,我的能力值多少钱,在面试中多表现,让对方感觉你重要、值钱。如果有其他 Offer 更好,直接有对标价格。例如现有 40K,市场涨 20% 到 44K,但如果已有 48K Offer,就有竞争力,找感兴趣机会要更高价钱。因此,先了解市场行情,面试中凸显价值,有多个 Offer 对比最好。
Q8:如果手上有多个 Offer,该如何选择?
York:选择 Offer 是艺术活,可能三五年才选一次,一定要慎重。有些人简单粗暴谁钱多去谁,这是错误观念。选择 Offer 像投资,投钱买股票是投多少钱,但投自己是赌上未来三五年,所以投资维度需要多元,不能仅以薪资为导向。
我通常喜欢从大到小看维度:从赛道、公司、团队、薪酬、做的事情一路往下看。一定要去朝阳行业、朝阳赛道,不去夕阳产业,否则没有发展,投资失败。找潜力高的公司,不一定要规模大,规模大可能去年 10 亿、今年 8 亿、后年 5 亿,没机会;最好找去年 3000 万、今年 5000 万、明年 8000 万的上升期公司。赛道公司选好后,看团队文化、老板如何,与优秀的人共事,你也会更优秀。毕竟身价是身边最近五个人平均身价的平均值。最后对比薪酬,从投资角度,未来发展预期比薪酬更重要。
具体指标一句话总结:找有兴趣、能干、长期回报好的机会。
第二环节:对话两位技术专家
本轮的访谈嘉宾是两位技术专家,从技术面试官的角度来给大家去剖析一下,如何找到 AI 大模型方向的工作,以及要做哪些技术准备。
Leo:知名电商公司技术专家
在 AI 与大模型领域具备丰富的落地经验,曾在金融和电销等多个场景成功落地 AI 应用。精通 Agent、RAG 等 AI 工程技术,并具备模型的预训练与后训练实操经验。其项目成果成为多家企业内训案例,并成功辅导百余人通过知名大厂及外企面试。
凌智:某一线大厂系统架构师
擅长供应链机器学习与深度学习的预测训练及推理系统设计,将大语言模型(LLM)技术融入供应链核心环节,主导构建了基于大模型的预测与问答系统,显著提升预测准确率与算法可解释性。在算法工程团队的岗位培训、知识体系搭建与人才技能提升方面,具备丰富的技术面试与人才评估经验。
Q1:对于想转型的程序员来说,您认为必须掌握的硬技能是什么?
凌智:从 Java 后端开始说,如果想从事大模型开发,第一步要先学习 Python。从语言层面学起,业内情况看,Python 技术栈在大模型、深度学习、机器学习领域仍是主流或重要技术栈,建议扎实学好 Python。 包括 Python 语言机制、常用工具库、数据处理工具库、网络工具库、监控、分布式处理、多线程、并发机制等,就像学 Java 一样,需好好过关。
第二步,大模型与传统系统不同,底层是概率模型。后端开发测试通过即 100% 通过,但大模型存在幻觉问题,系统搭建跑通第一个 case 不代表效果很好,问答可能差,不是用户想要的,可能有错乱或幻觉问题。因此需对输出结果和模型结果做数据分析和统计。这就要求转型的同学有数据分析和统计学基本常识,如看数据、看指标、查 bad case、建立反馈流程、发现问题。这对转型人工智能、大模型、深度学习或机器学习都有加分效果。
第三步和第四步合起来说:掌握机器学习基本概念,比如模型是什么、如何评估模型好坏、调参、特征选择、模型融合,深度学习基本概念如神经网络、梯度下降、反向传播、网络结构,大模型 AIGC 技术基础 Transformer,对 Transformer 结构有基本了解,不用像算法同学那么精通,但每层是怎么回事要懂。如果要训练、推理,网络出问题要能看懂输出。第三步也要对 Python 深度学习库如 Torch、Transformers( Hugging Face 库)特别了解,常见需求是用 Hugging Face 的 Transformers 库加载模型、数据集,可能满足很多需求。
再加上掌握微调模型、微调常识、优化指标,很多需求就都可覆盖。而且最好是大家花点时能达到那个原理级和源码级的这个了解。
第四步:考虑每个人发展在 AI 浪潮中的生态位,我分了四个层面:最底层硬件层面,如 GPU、TPU、CUDA,包括 Torch 适配华为机制。往上深度学习框架,做分布式训练和编译优化,如分布式训练 DeepSpeed、Triton,企业都会用到。再往上数据运维层面,如大模型运维 LLMOps、推理加速 TensorRT 等。再往上应用层,如 Agent 和 Prompt 提示应用层,到这层面要对 LangChain、RAG 框架、向量数据库等熟悉精通,有数据系统情况下能串通 Agent 流程、RAG 流程,市场上会更有竞争力。以上这四个层面都会有很多机会和岗位。
Leo:在 AI 时代,我自己总结三点:一是数据,数据是核心。我们有各种数据,如网页、APP 用户行为、用户画像、购买产品等动作产生的数据,是大小模型训练中样本特征的源头。有离线实时特征后,才能做数据加工、特征转换、归一化,针对不同业务场景做小模型大模型训练,再做预测评估。因此需掌握数据处理全链路技术能力,包括采集、加工、处理、管理、数据质量、数据应用。这涉及 Python、实时离线数据处理框架、各种云平台、数据服务、实时数仓等。
二是算法,从传统机器学习有监督学习、无监督学习、分类模型、回归模型,到神经网络、深度学习,再到 Bert、GPT 阶段,再后来 DeepSeek V3 到 R1 推理模型。这些构成从小模型到大模型发展趋势,以及真正到应用级别的大模型。因为模型的训练知识其实是一个有时效性的工作,需外接一个日常更新的知识库,包括文本、多模态,涉及多种模型支持知识召回和产生。
第三点:现阶段对业务理解我觉得反而提升到了更重要高度。作为技术人员,现在有 AI coder 编程,如 Design to coder、PRD to coder,如 Cursor,它们根据设计出码、出产品,能力非常强。但我觉得技术人员越到往后的阶段,比如 AI 应用、模型训练、评测各环节,“对业务的了解”才是真正的护城河,许多领域知识如电商、金融交易、信贷是私域知识,不存在于网页。例如信贷场景有贷前、贷中、贷后,准入、授信、支用等等,这些涉及到了不用角色、不同领域、不同业务阶段,所以能有对应的这些私域知识就可以被模型结合工具能力去覆盖,从而帮助我们提效。
还有姚老师讲的用户增长岗位,当前经济下行阶段,用户增长包括拉新、促活、挽留、召回,涉及模型层面对用户理解、用户打标、产品推荐,关系密切。只有找对用户、找准产品、给合适人推荐合适产品,企业才能更好发展。
Q2:面试中候选人的什么经历或者项目会让您眼前一亮?
凌智 :我一般看候选人资历。如果候选人资历在 4 年以下或左右,面试中更多考虑基本能力,如基本 Java 能力、对开源 Java 中间件、Java 类库原理掌握程度,或开源源代码掌握程度,还有一些基本算法,如快排、网络搜索等算法优化能力。这个年限基础能力最关键。对后端同学,常见中间件、MySQL 缓存、分布式、提高稳定性、内存泄露等问题,要特别扎实准备,至少不要有明显理解漏洞。
4-6 年之间,在企业中成长到独当一面或项目核心研发角色。对需求的分析理解、所在细分领域业务背景理解、如何把业务知识转化为架构知识、做可维护性和可扩展性都很好的架构,这些会作为我的考察重点。
至于什么让人眼前一亮,对 3-4 年同学,对某一开源项目有特别深入理解,哪怕对 MySQL 有特别深入理解、对 MySQL 锁机制、JVM 锁机制有特别深入理解,具体实战中解决过难以解决内存泄露问题、线上应急故障问题,这都会让人眼前一亮。对 5-6 年的同学,产品经理提出问题能完整给出技术解决方案,直接闭环拿到项目结果,如果中间踩过比较多的坑,就要在面试之前准备好一个特别的难题,强调你是怎么解决的。
Leo :校招同学重点看潜力,校招亮点是学校有 paper 或有开源项目,利用业余时间做前后端尝试,或将学到机器学习、现有 AI 技术落地产生小项目,如拿模型做数字人对口型尝试。P6 级别要能独当一面,负责项目模块,从需求分析设计到研发上线,到稳定性、压测、参与大促,以及发现模块后续技术发展方向,这要求可能比较高,但在现阶段 AI 编程更发达情况下,分析角度尽可能往参与业务角色考虑。比如 C 端可能面临用户体验、客户原生问题,可从舆情分析到可能出现 bug 分析产品改进方向,这属于 P6 同学的亮点。
P7 同学是整个大方向负责人级别,能看到 2-3 年技术发展方向。比如之前从事电销方向,包括 C 端对话机器人 AI bot、B 端运营专家和电销同学角色,能理清各角色各系统关联关系,通过这些关联关系如何进行领域设计如 DDD、微服务建设。从系统建设层面,如何建设数据能力,如每次和客户对话、电销场景从数据层面分析问题,如客户意图、客户对哪些产品感兴趣、客户分层、权益活动设计,更多从业务角度辅助产品经理、运营联动。这是 P7 亮点,以及现阶段利用 AI 如何为业务降本、为业务开源,如数据客户画像、投放、用户增长策略经营。
P8 级别可能考虑团队管理、行业领域专家、行业影响力。
Q3: 现在新技术层出不穷,对于一位处于成长期的工程师,如何判断哪些技术值得投入宝贵时间深度钻研,哪些只需了解即可?
Leo :我觉得现在知识爆炸年代,最关键一点是要有舆情分析观念,如年初 DeepSeek 爆火时,一定要花时间先用起来,从 V3 到 R1,然后再考虑更多东西。使用后,一定要把新模型替换到原来业务应用模型,做评测和做实验,这样知道第一我能知道他的适用领域方向,第二知道它能为业务带来哪些数据提升,如评测的召回率、准确率等。我自己觉得还是要紧跟国外模型,比如 Gemini 多模态好,Claude 的 Sonnet 编码能力好。像 Cursor 这种 AI coder 工具,一定要先用,不要等,并且用到业务上。业务除信息安全外,大部分可做到自己通过 Excel 做样本加工,清洗出符合训练的语料,自己尝试做后训练 SFT、PPO、RM 奖励模型,只要上手就知道哪些场景好,不适用哪些场景,这就是在干中学过程。
凌智 :我觉得首先有简单指标,对某技术模块感兴趣可先看 GitHub 上 star 数量,有多少星,多少人关注,用到过哪些项目里。高星或近期关注数上涨厉害,肯定是近期亮点。也可关注更新频繁、阅读量高的微信公众号,感受行业近期框架变化。
有一点我特别赞同 Leo 老师:学技术得想怎么用它解决项目和工程里的问题,是否比原来技术更好?如果更好,大概率生命力特别强,尤其又简单又好,集成难度低,基本上流行可能性非常高。所以还是需求驱动,加上有直观方便观察评价指标。
Q4:很多技术不错的同学在面试或晋升答辩时,无法把自己的工作价值清晰、高大上地表达出来。您有什么技巧可以提升一下这方面的能力吗?
Leo:最近几年包括自己参加晋升场、看过晋升场,变化最大一点是评审们一定要问为什么做这个东西?还是那句话,做技术尤其是给公司打工,一定要帮助业务解决实际问题。两点:帮助现有业务降本,帮助现有业务提效。讲清楚通过技术能解决什么问题。为什么做这件事,使用什么手段帮助客户帮助自己业务达到目标。最好用数据分析能力做一些报表,数据出发相对于技术出发能更好讲清楚这个故事。
凌智:我在公司前后五年时间晋升评审都参与了。总结最关键一点:一定要用数据量化方式把自己工作成果用指标清晰给出,结果是什么?指标一定要和业务挂一起。要有明确指标,只有数据最能说明工作成果,没有数据有点模糊,不具备可比性。
数据是第一步,第二步是从数据出发向下拆解细分,证明做这些工作确确实实和数据提升有因果关系。还有一点怎么体现工作高大上?提供技术解决方案时有没有做同业对比?如做电商,是否和美团、拼多多、阿里做过同行对比?行业怎么做?你怎么做?开源项目怎么做?你怎么做?做技术解决方案时起码看开源项目,至少调研过业内和开源情况,为什么不用同业方案?为什么不用开源方案?或基于同样开发基础做了哪些更新更好改进?改进点因此带来什么结果?逻辑关系一定要表述清楚。
技术材料呈现上,个人建议数据一定要有,数据一定要明确,因果关系明确。同行业对比可用架构图、框图做对比关系。案例不建议特别多,可能两三个,我在评审场一个场下来好多人,公司评审同时进行好多人,评委可能疲劳,材料一定要关键字高亮,特别精悍,关键案例就两三个,关键词特别明确。
还有一点很重要:扣准大家晋升职级的要求,每个职级有每个职级要求,如 P5 到 P6 参考阿里职级,阿里职级在行业也是有参考意义的,晋升前要知道要求一定要卡上要求,如我是 P5 升 P6,肯定到达 P6 的要求后才能做 P5 升 P6 动作。写材料时就要奔着 P6 要求写。问题里问到的怎么“高大上”地表达,我觉得最清晰的东西就是最高大上的。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. AI 大模型人才市场需求旺盛,尤其是在 AI 新业务的大厂开发岗位和 AI 创业公司。 2. AI 相关岗位需求包括算法、工程、全栈、产品、运营等,且需求取决于公司阶段和类型。 3. 薪资范围因人而异,顶级算法人才薪资极高,而工程岗位的薪资标准化程度较高,且受学历背景和应用经验影响。 4. AI 时代为传统技术岗转型提供机会,建议寻找可迁移的能力,逐步转向目标方向,选择适合个人情况的公司。 5. 在面试中,候选人常犯的错误包括以产品经理视角面试、过度自我介绍、不以用户视角思考问题等,应避免这些错误。 6. 在薪酬谈判中,候选人应了解市场行情、强调自己的价值、有多个Offer对比,并留有谈判空间。 7. 如果手上有多个Offer,选择时应考虑赛道、公司、团队、薪酬、做的事情等多个维度,而不仅以薪酬为导向。 8. 对于想转型的程序员来说,掌握的硬技能包括Python语言机制、数据分析和统计学基本常识、机器学习和深度学习基本概念、深度学习库如Torch、Transformers的了解、硬件层面、深度学习框架、数据运维层面、应用层的技能。 9. 面试中候选人的经历或项目会让面试官眼前一亮的包括对开源项目有深入理解、解决过难题、有独立负责项目模块的经历、对业务的深入理解和解决方案能力。
2025-12-24给文章提建议
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《极客时间 VIP · 干货直播稿精选》
《极客时间 VIP · 干货直播稿精选》
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论