来源|多知
6月25日,国产大模型龙头DeepSeek的一则招聘公告引发全网关注。
此次招聘规模很大,DeepSeek表示“正努力将所有部门的规模扩大至少一倍”,包括算法、AI核心系统研发、运维、AI产品、数据、深度学习研究员、职能部门。
前段时间,消息称,DeepSeek获得成立以来的首轮外部融资,募资总额超500亿元人民币,创下中国AI行业单轮融资规模之最。人才扩招可以视作DeepSeek融资后的第一个动作。
实际上,不止DeepSeek,腾讯混元大模型相关、字节跳动豆包/AI搜索方向、阿里巴巴通义千问/云智能、百度文心一言、月之暗面(Kimi)、京东、快手等持续释放大量算法及应用落地岗位。
这对当下希望进入中国大模型公司的求职者来说多了不少机会。
DeepSeek在算法和数据等核心业务上对人才有哪些要求?
在此次招聘公告中,DeepSeek仅提到了用人原则:“让新人直接承担最核心、最重要的任务,在这里,许多同学迅速成长为行业顶尖人才,成为推动AGI发展的中坚力量。”
DeepSeek称,当今人类正处于AGI的前夜。加入DeepSeek,可亲历AGI的发展进程,坐在时代前排,见证一个新纪元的诞生,“我们从来不寻找天才,只要你有自身闪亮发光的地方,你就是我们要寻找的人。欢迎加入DeepSeek,一起照亮未至之境。”DeepSeek在招募公告中写道。
有网友分享过面试经验,姑且作为参考,以小见大。
早在2025年2月,知乎博主“宫水三叶”提到,一位 211、985 高校的应届博士生,在校期间也参与过不少企业的大型项目,但在面对DeepSeek面试过程中提及的那些深入且具有挑战性的问题时,仍然感到不少难度。
用这位博士生对 DeepSeek的评价原话来说就是:“在我所经历过的互联网公司中,DeepSeek 是唯一一家会根据应聘者的专业背景量身定制编程题目的公司。”
想要进DeepSeek,通过 DeepSeek的面试只是第一步。
除了面试内容的深度和广度,这位招聘者还提到当时DeepSeek面试流程是「面试官连续 3 个小时高强度的提问」。
此前,根据公开信息,DeepSeek整个团队超七成是本硕学历,超七成不到30岁。
对于如何进入顶级AI团队,谷歌DeepMind杰出工程师、Gemini预训练负责人弗拉基米尔·费恩伯格(Vlad Feinberg)今年5月在他自己博客中写的一篇文章《How to Land a Frontier Lab Job》(《如何进入顶级实验室》)可以作为参考。该文阐述了进入前沿AI实验室(如Google DeepMind、Google Research、OpenAI或Anthropic)所需的条件。
这篇文章不仅有对在大模型领域求职的年轻人的建议,还有案例,以及实操的具体练习内容。其核心方法论对当下希望进入中国大模型公司的求职者,同样具有一定的参考价值。
弗拉基米尔·费恩伯格本科毕业于普林斯顿大学计算机科学专业,随后在加州大学伯克利分校 RISE 实验室攻读并获得博士学位。
博士毕业后,他曾加入一家名为 Sisu 的初创公司担任机器学习主管,之后进入谷歌研究院参与 Cerebra 项目。
早期入职 Google Brain 时,他并未急于发表论文,而是通过调整编译器和超参数等基础工程工作,帮助第一代 Bard 模型顺利跑通。
后来在谷歌 DeepMind任职,担任 Gemini 预训练团队的主管。
弗拉基米尔.费恩伯格表示,这不是一篇放之四海皆准的建议帖。只是他个人眼中通往理想岗位的一条清晰路径。
弗拉基米尔.费恩伯格《如何进入顶级实验室》一文的核心观点如下:
顶级AI人才三大底层特质
弗拉基米尔·费恩伯格认为,前沿实验室竞争极其激烈,对手是来自顶尖大学的本科生或者博士生,他们已在顶会发表论文、有竞赛奖项,并通过校友网络建立了内部连接。
这批人的成功可归因于三项底层特质:
第一,Intent(目标感),选择高价值问题领域专注深耕。
第二,Mathematical maturity(数学成熟度),解决模糊问题的泛化能力。
第三,Grit(韧性),经历过高难度课程训练的磨砺。
找准方向,不惜一切代价避免空谈
不要一上来就说“我对AI感兴趣”。要精准定位实验室真正需要人的地方:在底层,死磕FlashAttention、量化推理、内核编程;在高层,构建智能体循环和LLM辅助的实验设计。这些领域门槛较低,你可以自学掌握,而且实验室每天都在使用。
拿出拼劲,不要畏惧苦差事
不要看不起“脏活”或“基础活”。弗拉基米尔·费恩伯格说:“每六个月反思一次自己想要什么、想达到哪里,持续局部优化,从不鄙视‘卑微’的工作。如果找到了对的地方挖金矿,就只管继续挖,不抱怨泥土。”
在大学那些年,周末泡在图书馆是常态,社交活动能砍则砍。弗拉基米尔.费恩伯格曾和一位朋友靠着一杯杯浓咖啡硬撑了一整天——他们就是这样咬牙挺过来的。如果你想和那些顶尖同龄人一较高下,没有这种基础强度,基本等于出局。
最重要的方法论:从LLM栈的两端切入
他认为,正面硬刚训练大模型不现实(资源门槛太高)。更务实的做法是从两端迂回突破:
路径一:往“下”走——内核与系统优化(Kernel Work)。
在LLM栈的下方工作,即编写和优化内核代码(Kernels),让模型在GPU/TPU上跑得更快。
所有LLM项目最大的瓶颈是性能优化。每个项目都需要能在内核层面调优的人。而且LLM自己还做不到这一点。
如何入门?
直接动手——找运行缓慢的开源模型,让它跑快;
只需要够跑一次前向传播的加速器,反馈即时的基准测试;
学的不只是编码,更是对物理加速器设备细节的感知与整合,以及科学地把时间花在关键处。
路径二:往“上”走——智能体系统(Agent Work)。
在LLM栈的上方工作,将LLM作为灰盒,通过搭建Agent系统产生有用的输出。
不只是简单地使用Agent或写CLAUDE.md,而是建立严谨、可控、技术性的实验,评估单个或多个LLM Agent的行为。
这个领域太新,还没有清晰的路径,正是入局的好时机。
基础能力要求
在基础能力要求上,数学成熟度无替代方案,必须经历:选修难度大、基于证明的课程,大量刷题,啃理论;涉及范围有优化理论、规模法则、模型演化逻辑。
在弗拉基米尔.费恩伯格看来,在数学成熟度上是个分水岭,跨过去是研究者,跨不过就是操作员。
主题知识方面,要对LLM的历史和理论有扎实理解。
要通过仔细的文献回顾,阅读高被引的语言模型论文;内化概念,能与研究者高效对话;做教材中的练习有助于培养数学成熟度。
用开源项目突破,而不是靠简历
把你的代码放上GitHub:做复现、提改进、跑基准测试。这种能力拿出来让大家看到,它们比纸面上的东西有说服力得多。
论文+动手复现:两手都要硬
深入研读FlashAttention和SnapKV等经典工作,摸清LLM的版图。从Reiner Pope的访谈和Gemini Flash预训练讲座开始,再逐步啃下规模法则。
AI工具的使用原则
AI只用于你已经会做的事情上,但要激进地使用。绝不用它来学新东西或跳过思考。一旦产生依赖就完了——数学能力和韧劲永远建立不起来。
只有一条路:真本事+实打实的成果+不懈的拼搏
名校背景当然有帮助,但对那些没有名校背景的人来说,最可靠的打法就是拿出在内核或智能体方面可展示的成果,然后做好打5到10年持久战的准备。
《如何进入顶级实验室?》原文:
https://vladfeinberg.com/2026/05/10/how-to-land-a-job-at-a-frontier-lab.html
END