“理解语言,拥有智能,改变世界,是每一个NLP人的使命。”5月18日,百度技术委员会主席、自然语言处理部首席科学家吴华博士在成都举办的ACM中国图灵大会(ACM TURC 2019)上如是说。
作为中国计算机领域最有影响力的学术盛会之一,本届图灵大会以“注智世界,赋能未来”为主题,汇聚了包括曼纽尔·布卢姆、希尔维奥·米卡利、莱斯利·瓦利安特3位ACM图灵奖获得者在内的多名产学界世界顶级专家,共同探讨人工智能的前沿应用与发展趋势。吴华博士作为NLP领域世界顶尖的科学家,作了题为“知识与语言智能”报告,为现场数千名参会人士梳理了自然语言处理技术的演变与发展,同时介绍了百度在这一领域的长期积累与新突破。
“上帝为了阻止巴别塔的建立,让人们拥有了不同的语言,而跨语言沟通成了人们的共同梦想。如今,自然语言处理技术使得这一梦想触手可及。”吴华博士谈到,人工智能的本质就是让机器像人一样感知和认识世界。语言能力是人类区别于动物的最显著的特征,而自然语言处理技术让机器系统拥有人类的语言智能。自然语言处理从第一台计算机诞生之初,就开始萌芽,经过数十年的发展,凭借深度学习、大数据技术持续发展和知识的不断累积,自然语言处理迎来黄金发展期。而百度,则成为该领域技术发展的亲历者和引领者。
作为百度自然语言处理部首席科学家,吴华博士详细地介绍了百度在这一领域的深耕与布局。百度在语言和知识方面有深厚的积累,拥有最大的中文知识图谱,以及领先的语言理解和语言生成技术。百度自然语言处理技术的发展,同样得益于深度学习、大数据、知识图谱的强大助力。在深度学习方面,百度自主研发并开源的国内首个深度学习框架PaddlePaddle,拥有全面业务模型、超大规模深度学习并行技术和全面领先的高速推理引擎,支持千亿级别稀疏特征任务的并行训练。在深度学习模型拟合语言的同时,对语言“真正”的理解也离不开丰富的背景知识,为此,百度构建了包含实体、事件、关注点、地点、行业知识等在内的大规模多元异构知识图谱。这些描述真实世界的知识,被融入到基于实体关系的语义表征、知识增强的阅读理解、以及知识驱动的对话系统中,在深度学习模型与逻辑符号系统融合的探索中,实现对自然语言的更深入理解。基于上述技术,百度开发了PaddleNLP,提供了基于工业级数据训练的语义表示、阅读理解、人机对话等全栈智能文本处理能力。
事实上,本次图灵大会不仅是人工智能的知识盛宴,同样也是产学对话的一次难得契机。
作为中国人工智能企业的代表,百度在产学融合道路上做出的努力值得肯定。通过平台开源、师资培训、课程共建、技术竞赛、教材出版等多种形式,百度已经形成了一套多层次、全领域的校企合作模式。正如大会主题“赋能未来”表达的那样,百度正通过自身的技术革新和对年轻人才的助力,切实推动人工智能技术的发展,真正做到“赋能未来”。