首页 >> 2025年第05期

【封面故事】俞凯:心怀理想 向更远出发

作者: 蒋欣瑶 

发布时间: 2025-11-26

俞凯:男,1976年生,上海交通大学计算机学院特聘教授,机器智能研究所所长,思必驰公司联合创始人、首席科学家,上海市欧美同学会副会长、人工智能分会会长,语言计算国家人工智能开放创新平台负责人。国家级重大人才工程获得者,NSFC优青,上海市“东方学者”特聘教授等。清华大学自动化系本科、硕士,英国剑桥大学工程系博士。长期从事智能语音及自然语言处理、机器学习及人机交互的研究和产业化工作。发表国际期刊会议论文300余篇,获得Computer Speech and Language和InterSpeech等多个权威国际期刊和会议优秀论文奖,在语音识别、对话系统等国际评测中多次获得冠军。中国大陆首位国际语音通讯学会会士(ISCA Fellow),曾任IEEE Speech and Language Processing Technical Committee委员,IEEE Transactions on Audio Speech and Language Processing副主编,InterSpeech等国际会议程序委员会主席,ACL、EMNLP等国际会议研究领域主席。现任中国人工智能产业发展联盟学术和知识产权组组长,中国计算机学会语音对话及听觉专委会主任,中文信息学会理事,世界顶尖科学家论坛青年科学家委员会委员,全国信标委用户界面分委会委员等。

 

2012年,当俞凯辞去剑桥大学职务踏上归国航班时,他行李箱里装着两样特殊的行李:一份关于“统计对话管理决策”的理论蓝图和一枚承载着剑桥精神的大学校徽。

“祖国,总是选择那些选择了祖国的人;事业,总是选择那些选择了事业的人。”这句话,仿佛是俞凯人生抉择的最佳注脚。十三年后,这位思必驰创始人坐在上海交大实验室里,窗外黄浦江奔流不息,而他已从智能语音求学者成长为我国人工智能产业化的重要推动者。

 

科学精神的底色

 

俞凯的童年是在北京的军工大院里度过的。彼时,他对世界的认知朴素而纯粹,直到上了初中,才第一次知道清华大学的存在。和许多孩子一样,他对遥远的未来并没有太多具象的规划。然而,家庭的熏陶在潜移默化中开始为他描绘理想的底色。他的父母从事与导弹相关的研究工作,这份沉静而伟大的奉献,让他很早就萌生了一个信念:长大以后,一定要做一些有价值、有意义的事情。

这个朴素的新信念,在当年充满了时代的印记。他曾回忆,那时军工大院里的孩子们最热切关注的,就是“中国什么时候能出自己的航天员”。他也和伙伴们一样,经常憧憬着去参加招飞,用最直接的方式触摸到那份价值与意义。

2002年,俞凯从清华大学自动化系硕士毕业,他远赴英国剑桥大学,投身于当时还非常前沿的语音识别研究。2006年,他拿到剑桥大学博士学位,并留校继续从事科研工作。

 

俞凯与合作导师 Steve Young 教授的合影

 

英国人的生活,总是透着一份从容不迫的悠闲。上午十点上班,下午三点工作已近尾声,期间还伴着雷打不动的茶歇时分。但俞凯发现,身边做得越好的人,实则越勤奋。就如他在剑桥担任高级研究员时的合作导师,皇家工程院和科学院双院院士,剑桥大学副校长,创办了语音技术公司VocallQ(后被苹果收购,成为Siri语音助理背后的核心技术提供者)的“多面手”Steve Young一样,那些院士们常常凌晨一两点还在工作。

剑桥岁月,俞凯所收获的,比任何具体知识与经验更为珍贵的,是透入心灵的“科学精神”与“思维勤奋”。

在英国的学术体系中,严谨求实的科学精神贯穿始终。剑桥大学的标准并不在于发表多少篇论文,而是对真理与本质的探索,以及对研究价值与伦理的坚持。学校强调学生的自主性,鼓励独立思考、自由探索。

俞凯养成了“为解决一个问题而通览系统全貌”的研究习惯,他由此类比:“现如今的大模型多停留在散点信息的回答,缺乏系统性。唯有了解事情全貌,理解才会深刻。”

海外文化中对认真、专业与影响力的追求,让俞凯深刻认识到科学精神的重要性。一个念头在他心中愈发清晰:必须将这种精神带回祖国。

 

当洞见遇上时代浪潮

 

“思维的勤奋比肢体上的勤奋更重要,而两者结合在一起,就叫‘专注’。”在剑桥的十年,是俞凯专注深耕的十年,前五年研究语音识别,后五年研究对话系统,他几乎把实验室的所有方向都做了。

2012年,他敏锐地捕捉到两个关键信号:一是人工智能的曙光初现,二是国内产业环境已初步具备承接对话式人工智能完整链条的能力。“在英国,随处可见的是百年甚至数百年的历史建筑;而每次回国,我都能感受到日新月异的变化,这里蕴藏着巨大的发展潜力。”同年,中国正积极引进高层次人才,这一切,坚定了他回国发展的决心。

逐渐明朗的发展趋势与个人报国创业的志向,在2012年这个时间点上,产生了共振。俞凯毅然放弃了剑桥教职,踏上了回国的征程。

俞凯把统计对话管理决策的研究方向带回了国,当时国内学界对此缺乏系统性研究,仅止于极少的试点。他又率先将强化学习应用于工业级口语对话系统,这项技术如今已成为被ChatGPT等大模型广泛使用的核心技术。俞凯对人工智能的未来充满信心,早在行业兴起之初便注册了“AISpeech”这一今日已无法获批的“AI”商标。其中文名“思必驰”源于德国诗人海涅名言:“思想走在行动之前,就像闪电走在雷鸣之前一样”,这个颇具诗意的命名体现了他对技术趋势的准确把握。

 

2014年,亚马逊在国际消费电子展发布了Amazon Echo,第一次将智能音箱这个概念带入大众视野。这是人工智能发展历程中,将AI以声音为载体的大胆尝试。此时,智能硬件的人机对话交互市场呈现出爆发式增长,规模达到百亿量级,远超手机的十亿量级。

俞凯的预见已成为商业现实,然而他深刻地认识到,前瞻的技术并不能直接转化为产业优势。回国后,他加入上海交通大学,创立智能语音实验室,后来扩展为视听文一体化的跨媒体语言智能实验室。面对科技成果转化的资金难题,他提出了创新解决方案:自己创办企业,走上了产学研一体化道路。在上海交大的大力支持下,通过务实的知识产权许可协议,公司获得了市场资金支持,成功反哺科研,而学校则能在公司未来的盈利中获得收益。

 

2024 年 7 月 2 日至 3 日,中共中央政治局常委、国务院总理李强在江苏苏州调研。上海交通大学教授、 思必驰首席科学家俞凯向李强总理汇报了“上海交大 - 思必驰智能人机交互联合实验室” 产学研成果转化的应用情况以及大模型落地的最新进展

 

“没有科研创新,技术的持续领先就无从谈起。”俞凯将高校实验室定位为“原始创新的引擎”,而企业则专注于“在真实场景中发现问题,并将解决方案应用于工程实践”。他形象地比喻:“一个优秀的工程师,一定是一个好的科学家。实验室的作用就是把一个合格的工程师变成一个优秀的工程师。”

 

“工程师商人”的舍与得

 

从科学家向企业家的蜕变,俞凯完成了一次深刻的认知跃迁。

“技术是核心驱动力,但摆在商业的第一位就完蛋了。”这是他历经产业实践后的清醒认知。在他看来,即便拥有全球领先的技术,其成功落地的概率依旧微乎其微。

这番感悟源于他对产学研鸿沟的深刻洞察。真实产业面临的难题,往往是学校里不会研究的。俞凯将研究方向的源动力转向“用科学的方法解决真实的问题”,这些问题是在实验室里“拍脑袋”想不出的。真正的鸿沟,在于如何系统性地整合内部资源,构建完整的商业化能力。

“技术落地是一个系统工程。”俞凯总结道,“团队人才是第一位的,然后是对市场规律的认知、对产品的洞察、对技术适配性的把握,以及对客户需求的深刻理解。”

他十分认同任正非提出的“工程师商人”理念。研发先进的技术和选择合适的技术,是两种截然不同的能力。在真实的产业环境中,学会选择与舍弃,有时比追求极致性能更重要。“为更快打开市场,懂得在哪些地方适当做出妥协,这是一种智慧。”

这种系统性的产业思维,让思必驰在大模型浪潮中走上了独特的路径。俞凯提出“分布式智能系统”的构想:“我们不是在造一个全能的‘上帝’模型,而是在打造一个高效协作的‘智能公司’——有CEO、CFO、CTO等各司其职,规模更小、更高效,始终向盈利而去,避免无休止的烧钱。”

基于这一理念,思必驰构建了三大技术支柱:全链路对话系统,打破单点技术局限,从最终用户体验出发进行技术串联;软硬件一体化,在百亿量级的云端与设备端实现协同优化;大规模可定制,将服务国内厂商的经验转化为批量化、柔性制造的标准化能力。

这套“全链路系统性”的解决方案,是俞凯从科学家成功转型为企业家的生动实践,他实现了“最好是两个都懂”的双栖平衡。在保持技术进步的同时,懂得如何让技术创造真实的商业价值。

 

超越逻辑的信任

 

在俞凯的人生轨迹中,“相信”的力量激励着他一次次踏上未知的征途。

这份信念,最初源于高中语文老师李华云的言传身教。当时,俞凯所在的班级堪称天才与顽童的集合地,这里既有各领域的榜首,也有垫底的末名,俨然一个管理难度极高的小江湖。但李老师从不因学生调皮而动怒,她深信每个孩子本性正直善良。

她支持语文老师将所带的文科班与理科班的学生通过不同题材文章的创作接力,在文字中交流情感,从比较中催生进步。在她独特的教学理念下,创造了优等生与后进生亲密无间的学习环境。班集体共同创作的作品集,以及两位“清华十杰”的涌现, 都是李老师教育理念的最佳印证。

俞凯感慨道:“我们最终都是被她的信任所感动,她改变了很多学生的人生。”他们班级的故事还被改编成当年风靡一时的电视剧《十七岁不哭》,剧中翩翩少年简宁的原型便是俞凯。

俞凯的创业,同样始于一份纯粹的信任。思必驰创始人、CEO高始兴是他在剑桥打乒乓球认识的校友,几场球赛奠定了未来共同事业的基石。创业初期,他们只能一同住在毛坯房,白天奔波于各类科普活动,夜里差点被塌陷的床板砸到。“那时,高始兴为了收集数据,天天蹲在小学门口,差点被当成坏人。”俞凯笑着回忆道。

而公司的第一批投资人,则完美诠释了早期投资的“3F”原则——Family(家人)、Friends(朋友)、Fools(敢于冒险的“傻瓜”)。

现在看来,那时支持他们的投资人更多的是“投人为主”,包括联想之星的剑桥校友、清华同系同社团的师弟,以及剑桥结交的朋友。

“早期投资基于深度信任,既包括能力,更包括人品,超越了逻辑。”俞凯坦言,在一切商业模式还未完全清晰、前景尚不明朗的初创期,正是这份超越商业计算的信任,支撑着他走过最艰难的创业岁月,成为了思必驰破土而出的最初养分。

归国伊始,俞凯靠着这笔早期资金和政府的支持创业。其剑桥博士身份在当时也未引发任何关注,可谓寂寂无名。如今,俞凯的身上汇聚了众多荣誉,包括新近当选的国际语音通讯学会会士,该荣誉旨在表彰在语音通信科学与技术领域作出杰出贡献的会员,他是中国大陆的首位当选者。

但他更看重的,或许是思必驰的技术已装进全球60余家车企的车身、200多家智能家电的大脑;是他们的智能语音对话技术在百亿量级的硬件中运行,真正实现“沟通万物、打理万事”。“我认识世界的目的是改变世界,并且当我改变了世界,我才能更好地去认识世界。”俞凯说。

 

既有鸿鹄志 又有平常心

 

回望留学路,俞凯认为:“对我而言,出国留学最大的价值是真正打开了视野。我能亲眼看到不同的文化、不同的思维方式,它们没有好坏,而是各有特点。这种经历会丰富我们对世界的认知,无论对做学术还是创业,都是一种宝贵的创造力来源。它会转化成解决问题的能力,也会帮我们建立起国际化的人脉圈。”

在俞凯看来,要学会选择大的舞台,中国是一个充满机遇的广阔舞台,发展的空间和回旋的余地同样大。但在这个过程中,心态特别重要。既要有鸿鹄志,又得有平常心。很多人回国后,最初遇到的挑战可能不是技术,而是怎么融入国内的环境,适应这里的体制规则与文化。这时候,我们得真正去理解这片土地,保持勤奋,尤其是思维的勤奋。

(作者:上海报业集团编辑)