发力语音交互,月之暗面纳入前微软强将 AI玩家中谁将组成大模型“最强战队”?

前沿技术的比拼中,人才极为重要。

10月24日,《每日经济新闻》记者从“月之暗面”公司方面证实,业界顶尖的语音技术专家——微软亚洲研究院前首席研究经理谭旭已正式加入月之暗面,将和团队一起为Kimi用户研发更加先进和好用的智能助手。

图片来源:视频截图

《每日经济新闻》记者也注意到,Kimi近日开启了语音通话功能的灰度测试。与之对应的是,月之暗面多次对外表态坚定追逐多模态,例如在今年5月的第五届上海创新创业青年50人论坛上,月之暗面创始人杨植麟表示,多模态是公司当前持续的重点投入方向。

在技术飞速更新迭代的大模型领域里,人才密度往往是公司模型、产品能否跟上脚步、进而领先竞争对手的关键因素。

“最重要的本质还是人。”英诺天使基金合伙人王晟曾在接受《每日经济新闻》记者采访时曾表示,投资AI早期项目时,考察重点在于团队,“在(创业)方向基本一致时,投资人觉得最重要的就是团队因素”。

招聘市场上的波动则更为直观地反映出大模型人才争夺战的激烈程度。脉脉人才智库的数据显示,随着ChatGPT声名大噪,2023年3月,大模型岗位招聘指数(该数据越大,说明招聘岗位量越高)达到2023年以来的峰值,为87.15。

与此同时,头部科技公司、互联网大厂和明星独角兽之间的人才流动没有一刻不在持续着。对于这群最先踏入新时代的AI玩家来说,谁都想集结一支“最强战队”,去实现更多未知的可能性。

发力语音交互,月之暗面麾下再添一员大将

两篇关于“Transformer-XL”与“XLNet”重要论文的第一作者、中国35岁以下NLP(自然语言处理)领域引用量最高的研究者——类似的诸多头衔让杨植麟的第二次创业在一开始就颇受业内关注。

2023年6月,月之暗面刚成立不久,就完成了超2亿美元(约合人民币14.2亿元)的天使轮融资,投后估值约为3亿美元(约合人民币21.4亿元)。最新的一笔融资在今年8月,月之暗面获超3亿美元融资,此轮融资也将月之暗面的估值推到了33亿美元(约合人民币235.0亿元)的高位。

图片来源:网页截图

人才随着资金弹药一起涌来。10月24日,《每日经济新闻》记者从月之暗面方面了解到,微软亚洲研究院前首席研究经理谭旭已正式加入月之暗面,据介绍,他“主要是帮助Kimi打造更自然、更流畅的语音交互体验”。

公开资料显示,谭旭研究领域为深度学习、语言/语音/音乐处理以及AI内容生成,在AI学术会议发表论文100余篇,出版学术专著《神经语音合成》。

他开发的机器翻译系统在中英翻译上达到人类水平,并在WMT机器翻译比赛中获得多项冠军。同时,谭旭的研究成果也在Azure、Bing等微软重要产品中得以应用。

同时,《每日经济新闻》记者注意到,Kimi在语音功能上也有了新的进展,现已开启语音通话功能的灰度测试。对此,月之暗面方面向记者表示,除了常规的对话之外,目前该功能还提供英语陪练和模拟面试两个专门的对话场景。

实测Kimi、豆包和通义千问的语音功能后,《每日经济新闻》记者发现,目前Kimi的语调、语音内容自然且口语化,但它是三者中唯一需要使用者手动打断对话的产品,其余两款产品均可实现智能打断。

“智能打断和方言、口音辨别都是在语音模型里比较难训练的能力。”一位大模型技术人员向《每日经济新闻》记者表示,除了单独训练一个辅助实现打断功能的模型,有端到端能力的模型可以压缩响应时间,实现实时语音打断。

在今年5月的OpenAI春季发布会上,新发布的GPT-4o展示了其更为流畅、自然和智能的语音交互功能。在带来更新体验的背后,是GPT-4o通过端到端训练了一个全新的模型,能够同时处理文本、视觉和音频输入输出。

大模型人才争夺战进行时,谁能组成“最强战队”?

这是一个极度渴望人才的行业,人等同于战斗力。于是,头部科技公司、互联网大厂和明星独角兽之间的人才流动在大模型业内屡见不鲜。

这一点从多个创业公司创始人的履历中便可窥见一二。例如,“AI六小龙”之一的MiniMax公司的创始人闫俊杰,曾担任商汤科技副总裁,阶跃星辰创始人姜大昕曾是微软全球副总裁、微软亚洲互联网工程研究院的首席科学家。

此外,类似谷歌“TensorFlow”平台前核心创始成员潘欣去年加入“零一万物”公司担任首席架构师、阿里通义千问大模型技术负责人周畅离职,这样的成熟技术人才的就职变动也是业内“寻常事”。

《每日经济新闻》记者从字节跳动内部人士处确认,原零一万物核心成员黄文灏在今年8月加入“Seed”团队,汇报对象为大模型团队负责人朱文佳。

对此,零一万物回应《每日经济新闻》记者表示,黄文灝离职是因有其他追求。“近期,有多位负责模型训练、多模态和产品的,(具备)国际顶尖大厂履历的高阶负责人加入零一万物,已经履职数月,为零一万物的模型和产品的持续迭代升级和商业化探索注入新动能。”零一万物方面介绍。

招聘市场上的数据也印证了各大企业对大模型人才的争夺日趋激烈。脉脉人才智库的数据显示,ChatGPT的走红迅速引发了国内市场的“抢人大战”,2023年3月,大模型岗位招聘指数达到2023年以来的峰值。其中,技术人才最为炙手可热。2024年1月~7月,大模型领域热招岗位的前10位中有9个为技术岗位,算法工程师是新发岗位量最多的。

各大团队都以高薪向高学历技术人才伸出橄榄枝。脉脉人才智库的数据显示,在大模型领域的人才招聘中,要求硕士及博士学位的岗位占比达29.66%,显著高于新经济行业平均水平的11.28%;据2024年1月—7月的数据,大模型领域算法相关岗位平均月薪超6.75万元,位居高薪岗位第一。

今年7月,字节跳动面向2024年9月至2025年8月毕业的博士群体开启了“筋斗云人才计划”,这是继“Top Seed人才计划”后另一AI人才专项招聘计划;腾讯、百度等互联网巨头也开启了大模型技术人才专项招聘计划。

根据脉脉人才智库的调研,在2024年1月—7月,大模型新发岗位量最高的10家企业中,字节跳动位列第一。字节跳动招聘官方公众号在10月22日发布报告称,2025届校招中,报录比最高的前两个岗位分别是大模型技术专家和AI算法工程师(如下图)。

图片来源:微信文章截图

一位业内人士向《每日经济新闻》记者透露,目前月之暗面的规模还不足200人,“感觉大家还是在抢人才(的阶段)”。古语有“兵在精不在多”,相信在大模型领域里,无论是月之暗面这样的创业公司还是字节这样的互联网巨头,现在都对拥有更多的精兵强将野心勃勃。