解密王海峰与哈工大的AI渊源

  • 来源:网络
  • 更新日期:2020-06-23

摘要:“没想到你们哈工大的技术这么牛!”作为哈工大出版社的一名编辑,早已习惯了常年家、办公楼、食堂的“三点一线”普通日子,最近突然接收到不少亲朋好友的关

“没想到你们哈工大的技术这么牛!”

作为哈工大出版社的一名编辑,早已习惯了常年家、办公楼、食堂的“三点一线”普通日子,最近突然接收到不少亲朋好友的关怀,着实让我有些不太适应。

一问缘由,原来是靠人工智能“出圈”了。

先是百年校庆的无人机表演惊艳了全网,随后又进入了美国的软件实体清单,“吃瓜群众”才恍然得知,原来哈工大这所偏居边陲的高校,居然在当下最火的人工智能领域有如此深厚的功底。

哈工大人都知道,我们的计算机专业算是中国的先驱者之一。现在校博物馆里,还留着哈工大研发的中国第一台会下棋的机器人。

但我想说,如果说有什么人工智能方面的成就值得哈工大人铭记且自豪,归根结底还要数多年来的人才。

此前在一份“AI人才输出贡献”的榜单上,与哈工大一起排进前五的,还有北京邮电大学、中国科学院、中国科学技术大学和浙江大学。其中,哈工大是唯一不在一二线城市经济圈的高校,但从哈工大走出的AI人才在产业里,却绝对是一线的。

比如大家都熟悉的百度公司CTO王海峰,就是从黑土地上成长起来的AI巨擘。个人认为,要厘清哈工大与人工智能的渊源,王海峰其人,着实是一个值得深度观察的窗口。

所以由我们出版社策划的哈工大建校百年献礼丛书中《AI已来:让中国AI走向世界的王海峰》,就这样与大家见面了。

王海峰与哈工大:中国AI的前因与后果

1989年,王海峰考入了哈工大的“89322班”,89代表89级,3代表计算机系,22则代表硬件二班,自此开始与NLP(自然语言处理)结缘。

30多年前,会使用计算机的人都屈指可数,刚刚走进哈工大校园的少年王海峰,为什么会触碰到NLP这样的人工智能分支学科呢?

原来,当时哈工大是为数不多开始进军人工智能的国内高校之一。

早在二十世纪五十年代,哈工大的俄语教研室就参与了俄汉机器翻译研究。到七八十年代,李生、王开铸等前辈率先展开了翻译系统的研究。

及至王海峰初入学,李生教授带领的团队所研制的汉英机器翻译系统CEMT-I,就已经成为我国第一个通过技术鉴定的汉英机器翻译系统,获得了部级科技进步奖二等奖。研发这一系统的主要目的,是为了进出口电子仪器设备时翻译厚厚一摞的说明书。

1993年,大四做毕业设计的王海峰,被分配到李生教授的实验室。当时,CEMT系统已经进化到了第三代,而李生教授与课题组在国家“863”高技术研究发展计划的支持下,正在开展汉英-英汉双向机器翻译研究。

也是在这里,王海峰以机器翻译为媒介,与NLP相遇了。他接到的任务,是对CEMT-III进行优化,整合源代码,提升整个系统的运行效率。

当时在很多人眼中NLP还是镜花水月,但王海峰所接触的第一个项目,就对机器翻译有一个整体化的理解,而且是完全应用性质、真刀真枪直面用户的。这一点对于王海峰后来的学术研究,包括在百度工作,有着莫大的影响。

今天,哈工大在人工智能领域,既有李生教授这样的学术泰斗,也有刘挺、王晓龙等为代表的年轻专家和人才,成为我国人工智能领域的一支重要力量。除了机器翻译,哈工大在中文信息处理、语音处理、模式识别等各个方向上都有着深入而广泛的研究。

而身在产业界的王海峰与母校的联系,几十年来从未间断。

作为哈工大计算机学院兼职教授的他,还会在冗杂的企业管理事务之外,亲自指导并审阅学生的论文。据他的学生回忆,王海峰非常细致,改什么都是一个字一个字地改,英文论文是一个词一个词地改,十分讲究细节,并不是只提一提宏观意见。

担任哈工大人工智能研究院副院长的刘挺教授告诉我,王海峰身上有很多非常“哈工大”的地方。比如上一秒还在和大家一起笑闹玩耍,下一秒意识到自己需要学习了,就能立刻停下手头的事抄起书本奔向图书馆。甚至连他教育孩子,都不忘那句校训“规格严格,功夫到家”。

王海峰与AI的结缘虽然谈不上无心闯入,却是历史选择与个人选择的共同结果。

在本书中,我们采访了哈工大前后四代人工智能领域的多位师生代表,为大家还原一个真实的王海峰,同时,也一斑窥豹,得见哈工大与中国AI勤修不辎迎头奋进的三十年。

连接学术与产业:用一本书解答时代命题

现在,王海峰最众所周知的身份是百度的首席技术官(CTO)。而他身上有着不少闪亮的学术头衔:国际学术组织ACL历史上首位华人主席、ACL亚太分会AACL创始主席、中国人工智能产业发展联盟副理事长、大数据系统软件国家工程实验室技术委员会副主任、新一代人工智能战略咨询委员会委员。

在AI的江湖里,学术与产业,本来就不应该把彼此划分成两个世界。但它们之间,到底该如何恰到好处地彼此滋养,王海峰的探索与工作或许能带来很多思考。

作为中国AI的领军企业,百度通过百度大脑、百度智能云、小度、阿波罗等一系列技术和产业应用,支撑着社会不同领域的智能化。而这些底层能力的释放,离不开王海峰领导的百度研究院、AIG(百度人工智能体系)等团队在学术领域的持续突破。

比如百度自研的流式多级截断注意力模型(SMLTA),就让语音识别速度和识确度大幅提升,一声声“小度小度”回响在无数家庭的客厅;基于知识图谱的视频语义理解能力,让百度大脑可以实现很好的语义分割,帮助医疗、工业、矿业等等实现更加精准的图像识别,减少员工的作业强度……诸如此类的技术创新,激活了普通人对AI的新认知和想象。

其实,这种融合产业需求的学术创新,早在王海峰于哈工大求学期间就已经显露出来。

1996年,时任哈工大校长助理的高文(现为中国工程院院士)是王海峰的博士指导老师之一。随后高文加入了国家智能计算机研究中心与摩托罗拉共同设立的先进人机通信技术联合实验室(JDL),王海峰便也一同到了北京。

那时的他,已经通过参与BT863和CEMT-Ⅲ两个项目,对机器翻译技术有所涉猎。博士期间能不能自己尝试思考和更新一些东西?

王海峰在JDL实验室里,接触到卡耐基梅隆大学,开始将神经网络应用到语音处理上,便尝试将循环神经网络的方法引入了机器翻译,通过对神经单元的循环反馈使用让神经网络拥有“记忆”。在记忆模式下进行运算,就能结合语境和上下文进行结果的预测。

举个例子,当语句中出现“神马都是浮云”,机器可以通过联系上下文,判断出“神马”到底指的是“一种动物”还是“什么”的谐音。

哈工大和王海峰的创新,是中国第一次利用神经网络解决机器翻译这样的跨学科问题,将神经网络算法从相对单一的数学问题,引入到更复杂也更具价值的现实场景中来。从世界范围来看,都并不算常见,国内更是首创。

可以说,这种从产业需求出发结合学术突破的创新视角,伴随着王海峰的工作和成长,不断进入了企业和很多学术组织中去。

所以,在2018年哈工大成立人工智能研究院时,王海峰也受邀加入了学术委员会,将产业界的理念、资源、诉求带进来,与哈工大一起共同引领世界人工智能科技发展。

哈工大的人工智能之路发展了五十年,依然是少年。而王海峰作为推动中国人工智能学习、研究和发展的一份子,他的故事在哈工大建校百年的时刻读来,更让人感到教育之幸福,民族之希望,也是哈工大人奋斗历程的一个缩影。

当下,AI对于整个国家、整个社会的重要性不言而喻,但如何以更接地气的方式被大家所熟知,或许就像王海峰这样的优秀学子一样,像百年校庆上的无人机展演一样,用具象的人或事物,来展示哈工大乃至中国学术AI的价值。

读懂王海峰,某种意义上也是在阅读哈工大学术建设的寸进,探秘中国和AI握手的关键节点,厘清中国AI从黎明将至到全面繁荣的历史机遇。

这些值得探寻的答案,都随着王海峰的人生故事一一浮现。值此百年校庆之际,我也向各位校友、各位读者真诚地推荐这本《AI已来:让中国AI走向世界的王海峰》,相信大家将有所收获。

文字 |李艳文

图片 |哈尔滨工业大学出版社

来源:中国网

新网数码