百度CTO王海峰：语言与知识技术是人工智能认知能力的核心

登录注册

百度CTO王海峰：语言与知识技术是人工智能认知能力的核心

来源:网络
更新日期:2020-08-25

摘要：　　新浪科技讯 8月25日午间消息，在百度大脑语言与知识技术峰会上，百度CTO王海峰表示，“在百度语言与知识技术的布局和发展中，我们始终在注意把握两个趋势，即技术发展趋势和产业

　　新浪科技讯 8月25日午间消息，在百度大脑语言与知识技术峰会上，百度CTO王海峰表示，“在百度语言与知识技术的布局和发展中，我们始终在注意把握两个趋势，即技术发展趋势和产业发展趋势，并力争引领趋势。” 王海峰回顾百度语言与知识技术发展历程时表示，语言与知识技术是人工智能认知能力的核心。

　　2010年，百度成立自然语言处理部，历经近十年发展，百度已经构建了完整的语言与知识技术布局，包括知识图谱、语言理解与生成技术，以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的的应用系统。会上，百度发布了语义理解技术与平台文心、智能文档分析平台TextMind和AI同传会议解决方案3大新产品，同时发布了6项升级，包括智能创作平台的3个场景方案、以及智能对话定制与服务平台UNIT的3项升级。其中，语义理解技术与平台文心基于深度学习平台飞桨打造，依托领先的语义理解核心技术，集成优秀的预训练模型、全面的NLP算法集、端到端开发套件和平台，提供一站式NLP开发与服务。智能文档分析平台TextMind，基于OCR、NLP技术，以文档解析为核心能力，支持文档对比与文档审核，具备“多快好省”的核心优势。百度大脑智能创作平台针对媒体应用场景再升级，全新推出智能策划、智能采编、智能审校三大媒体场景方案；智能对话定制与服务平台UNIT升级3大特性：更智能的任务式对话理解、极致便捷的表格问答和融合通用的新对话引擎。此外，为突破数据匮乏、算力不足等历年来语言与知识技术研发中面临的瓶颈，百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划——千言，解决数据稀缺问题。

　　千言一期由来自国内11家高校和企业的数据资源研发者共同建设，已涵盖开放域对话、阅读理解等7大任务，20余个中文开源数据集。百度技术委员会主席吴华表示，“未来，我们希望有更多的数据集作者能够参与共建千言，共同推动中文信息处理技术的进步，建设世界范围的中文信息处理影响力。我们计划在未来3年，面向20多个任务，收集和建设不少于100个中文自然语言处理数据集，覆盖语言与知识技术全部领域。” 最后，王海峰对语言与知识技术的进一步发展做了展望。他表示，复杂知识表示和快速构建技术，知识与深度学习进一步融合，深度融合感知和认知的跨模态语义理解技术，模型可解释性和鲁棒性等等，仍有很多技术难题需要持续研究和解决。(杨雪梅)