定了！AI视觉泰斗朱松纯教授归国就任北大人工智能研究院院长

登录注册

定了！AI视觉泰斗朱松纯教授归国就任北大人工智能研究院院长

来源:网络
更新日期:2020-09-25

摘要：新智元报道来源：北大新闻网编辑：白峰、依明【新智元导读】刚刚，北京大学官网显示，前UCLA教授朱松纯受聘担任北大人工智能研究院院长，北大常务副校长龚旗煌代表学校，对朱松纯受聘北

新智元报道

来源：北大新闻网

编辑：白峰、依明

【新智元导读】刚刚，北京大学官网显示，前UCLA教授朱松纯受聘担任北大人工智能研究院院长，北大常务副校长龚旗煌代表学校，对朱松纯受聘北大表示热烈欢迎。此前曾有消息传出朱松纯拟入职清华，现在来看，还是北大「抢」得了先机！

北京大学新闻网发布消息：朱松纯教授受聘担任北大人工智能研究院院长。

这则新闻在AI学术圈再次掀起热议。就在本月中旬刚有消息传出「朱松纯拟加入清华大学自动化系，任教研系列教授」。

然而，知乎上入职清华相关的帖子现在已经被删除了。

前脚还传进清华，此时落地入北大

没有帖子，也没有传言。

9月24日，朱松纯已经以院长的身份在北大开了工作会议。北大常务副校长龚旗煌代表学校，对朱松纯受聘北大表示热烈欢迎。

朱松纯表示，他与北大、清华的相关学者一直保持着密切的学术交流与合作，有很多朋友和合作伙伴。近一段时间来，自己又深入考察了解了北大、清华等高校的情况。

在北大，他与多个研究方向的师生进行了充分的交流，深入了解了北大人文社科领域的发展状况，与多位知名学者进行了跨学科的探讨，收获颇丰。

朱松纯认为通用人工智能的实现，离不开哲学层面的思考，也需要与理工文医深入融合。

而北大在各方面都有深厚的积淀，因此，坚定了自己在北大开展人工智能研究的信心。

他将全身心投入到关键领域、重大问题的研究，培养更多国家需要的拔尖创新型人才，争取取得更多突破性、原创性的成果。

朱松纯还特别强调，他将主动发挥好桥梁纽带作用，推动北大、清华等各兄弟院校精诚合作，整合各自优势资源，形成合力，共同来参与、支持北京通用人工智能研究院的建设。

清华北大都来「抢」的朱松纯：三次问鼎计算机视觉最高奖

朱松纯于1996年获哈佛大学计算机博士学位，师从国际数学大师大卫曼福德教授，在国际顶级期刊和会议上发表论文300余篇，并三次问鼎计算机视觉领域国际最高奖项马尔奖。

朱松纯对计算机视觉有着自己独到的看法，在认知科学领域，如视觉常识推理、场景理解等领域做出了重要贡献。

他信奉一句话，「一个民族如果忘记了历史，她也注定将失去未来」，而这句话，对计算机视觉来说，也是同样发人深剩

他提到，现在很多新发表的视觉的论文，很少有文章能够引用到 5 年之前的文献，都是引用近两年arxiv上的文章，去比一些Benchmarks。

很少有人认真去看 10 年前，20 年前，甚至 30 年前的论文，而当时的一些思想和框架性的东西，对现在的研究仍有重要的意义，大家几乎都用同样的方法在比小数点后面的精度。

大家都相当短视，只关注这几年的历史和流行的方法，根本无法传承这个学科。特别是等当前这一波方法退潮之后，这批人就会慢慢失去根基和源创力。

谈到自己的学术生涯，他认为David Marr 对他影响最为深远。

60 年代开始的时候大家已经很多人研究视觉神经生理学、心理学问题，也有人做一些边缘检测的工作。但是，计算机视觉到底要解决哪些问题？如何实现？大家莫衷一是，谈不清楚。

David Marr 分出了三个层次来解决这个问题，分别是计算（其实应该说成是表达）、算法、和实现。

首先，在表达的层次，如何把它写成一个数学问题。任务是什么？输出是什么？这是独立于解决问题的方法的。

其次，对这个数学问题去求解时，可以选择不同的算法，可以并行或者串行。

再次，一个算法如何在硬件上实现，可以用 CPU，DSP，或者神经网络来实现。

除此之外，David Marr 还理清了视觉到底要计算什么。

Marr 提出了一个系列的表达，从primal sketch（首要简约图），到 2 D sketch（深度简约图），到 3D sketch。

这里面还包含了纹理、立体视觉、运动分析、表面形状等等。Marr认为，视觉计算不是单纯去求一个解，而是一个连续不断的计算过程，越看、越琢磨，可能得到的理解就越多。

值得一提的是，Marr 在1978 年冬诊断得了急性白血病，在得知来日无多后，Marr就赶紧整理了一本书《视觉：从计算的视角研究人的视觉信息表达与处理》，去世时年仅35岁。

朱松纯和同事在这本书上花了8年时间，把 Marr 提出的早期视觉概念，包括纹理、图像基元以及原始简约图等转换成了一个统一的数理模型。

从此，视觉就可以从纯粹的理论、计算的角度来研究了。

除了视觉的统计建模和计算理论，朱松纯还实现了图像与场景的解译（parsing）计算框架，扩展了模式识别创始人傅京孙先生的句法模式识别理论。

自2010年以来，朱松纯将计算机视觉与认知科学、自然语言理解、机器人等学科结合，探索他所称的「人工智能的暗物质」占95％的、无法通过感知输入观测到的智能。

现在，朱松纯团队构建了一个大规模、物理逼真的VR / AR环境，用于训练和测试负责执行大量日常任务的自主AI智能体。

这些智能体可以整合视觉，语言，认知，机器学习和机器人技术等领域的能力，在此过程中发展物理常识和社会常识，并使用认知架构与人类进行交流。

熟悉朱松纯教授的人，对他严谨的治学精神，也从不吝惜赞美之词。

他对数学一丝不苟，对视觉领域有着一流的直觉

微软亚洲研究院视觉组研究员代季峰，曾经在朱松纯教授的VCLA实验室访学一年多，为我们分享了一些朱松纯教授的学术人生。

对视觉领域大方向有着一流的直觉

朱松纯教授的实验里学生人数较多，自然要用雄厚的funding资金来支撑。朱教授在最近几年应该都是美国大学视觉界里funding最多的教授（不知道是不是要加个「之一」）。

从2011年起，朱老师的实验室，作为PI拿到的资助超过4000万美元，其主要原因就是其「研究思维超前」。

能够拿到这些大funding，意味着朱教授对这个领域的大方向「有着一流的直觉以及领先和准确的把握」。

而朱教授这种的「第六感」在多年前就已经有所体现。

2012年，朱松纯教授主持的一个MURI大项目在UCLA开会，他上台讲了一通「vision meets language」，说视觉和语言的结合会是一个重要的问题，比如看到一整个图片，系统应该输出一段话描述它，比如看到一个bounding box区域，要描述这里面发生了什么，这个用一个hierarchical的And-Or graph该如何实现。

当时很多视觉领域的大佬都觉得有些天方夜谭。没想到过一两年，这就是红极一时的VQA任务，不过是用神经网络实现的。

「能够提前感知到未来的大方向」，这是顶级的research感觉，这也是朱松纯教授最厉害的地方。

朱松纯教授提的大方向，虽然有错的，但是正确的概率已经是很高了。

对数学（尤其是统计）一丝不苟

跟朱教授讨论的时候，最经常被challenge的就是「这个算法不对，数学上是错的，这个CV领域最近火的技术在统计上是不对的」

对大部分研究者来说，概率模型流行就用概率模型，SVM流行就用SVM，神经网络流行就用神经网络。

而朱松纯教授是有信仰的，那就是他的「概率模型」，曾经在SVM之前引领了视觉领域的潮流。那是他们自己的东西，所以不像其他人那样可以轻易舍弃。

朱教授曾经说过「做research像下围棋，不能东下一颗西下一颗，地盘全被别人占了」。

对学生刀子嘴豆腐心

这是朱教授受到的争议最大的地方。

刚去他实验室的时候，会很不适应他的批评，但你慢慢了解他，就好了。

他对学生的长远发展和重要利益，是非常好的；虽然批评时很难受，但过后他不记仇；还有同实验室吴教授的平衡和调和。

其实学术圈的老板，脾气大一些、对学生push的非常多，算是research人的通病吧。

但最后找工作什么的关键时刻，他和同实验室的吴教授都是非常supportive，有人情味的。

朱松纯教授的女儿在年满18岁之际放弃了美国国籍加入中国国籍，也许从那时起，朱松纯教授的回国计划就已经提上了日程。

朱松纯这次回国，将为国内人工智能尤其是通用人工智能的发展，带来强劲动力。他也离「人工智能大一统理论」的梦想上更近了一步。

参考链接：

http://www.stat.ucla.edu/~sczhu/research_blog.html#VisionHistory（朱松纯：正本清源 | 初探计算机视觉的三个源头、兼谈人工智能，2016）

https://www.zhihu.com/question/59182074（文中评价来自微软研究员代季峰的知乎回答）