雷军千万年薪挖角 95 后 AI 天才少女,她有何经历?她将如何引领小米 AI 发展?
以前都说大模型三要素是数据、算法、算力,现在来看拼到最后拼的是人才。前有字节八位数年薪挖周畅,后有小米千万年薪挖罗福莉,大模型的盛况看来还会继续持续下去。
罗福莉自己在知乎就有账号 @罗福莉 ,硕士期间就在知乎上过一次热榜了:
如何看待北大硕士生在自然语言处理顶级会议 ACL 2019 上发表 8 篇论文?
今年 DeepSeek v2 发布以后,也在知乎回答了相关的问题,解答 DeepSeek v2 的一些技术细节:
如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2?

对于这件事,有些人批评雷军摘桃子,我觉得不完全对。在商言商,雷军的决策是正确的。
去年大模型虽然火,但说实话大家对于国产大模型还是信心不足的状态。即便今年国产大模型能力来到了第一梯队,但主流的几个 toC 产品依然是以免费为主,仍处在烧钱的阶段。
而且去年小米正处在造车的紧要关头,距离小米 SU7 上市临门一脚,拿出大量资金去烧一个没有收益的早期大模型,显然不明智。
今年 SU7 已经完全成功,小米的股价也跟着蹭蹭涨。手机圈去年也有折腾 AI 的,但纯端侧能力有限,Agent 还不可靠,小米现在回过头来做大模型,我觉得正当时。

豆包的情况其实也类似,上半年的国产 AI 明星还是 Kimi,说实话今年年中之前,豆包可以说是查无此人,只知道字节在做一个叫「云雀」的大模型。同样也是下半年快速发力,很快就在消费端赢得了不错的口碑。
另一个有趣的巧合是,字节和小米挖的人,分别来自于两个国际公认的优秀国产开源大模型团队,Qwen 和 DeepSeek,这两个开源模型在国际上的口碑非常好,不亚于 Meta 的 LLama。
而且前几天,DeepSeek 发布 v3 版本,对大模型界就像一次地震,大家惊讶地发现,幻方的团队居然可以用如此之少的卡,训出效果这么好的模型。有人甚至评价说,DeepSeek v3 颠覆了大家对 NVIDIA 算力的需求估算。

小米这次把 DeepSeek 的核心人员招过去,未必没有类似的期许。
最后,很多人觉得千万年薪夸张,其实眼下这行情,如果真是能带团队做模型训练并已经出过成绩的,在美国薪资应该会更高。
更何况,除了自身的人才价值外,宣传本身也是一种价值。从企业发展和商誉的角度,需要这样的 AI 明星来带领团队,以小博大制造更大的宣传效果。
这就是高质量人才的价值,「尊重人才、吸引人才、留住人才、用好人才」,没什么不好的。
期待小米大模型的表现。