图片 1

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。百度从诞生之日就和ai息息相关,多年来持续大力投入ai技术研发,推动百度大脑不断取得突破。截至目前,百度大脑已获相关技术发明专利授权200余项,在国际期刊和学术会议上发表相关论文100多篇,多次在webvision、activitynet、nips、semeval等国际知名人工智能竞赛或测试中夺得桂冠。百度连续三年上榜全球知名科技媒体《麻省理工科技评论》“全球十大突破性技术”榜单。国际期刊《自然》评价称“百度已成长为以ai技术为重心的科技巨头”。

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。4月15日晚,清华大学计算机科学与技术系教授,博士生导师
孙茂松作客黄浦江源大讲堂,为我校师生带来了一场题为“大数据与自然语言处理”的学术报告副校长万健教授主持报告会。
孙茂松通过《爆发:大数据时代预见未来的新思维》、《黑天鹅》两本畅销书,引出大数据能产生洞察力这一话题,他用详实的例证,为现场师生说明了语言计算的本质是结构预测。他指出汉语是世界上最难被计算机理解的语言之一,实时正确解读互联网中的海量中文信息,可实现高精准舆情分析,最大限度地弘扬正能量,同时抑制负能量的滋生和蔓延。但目前中文语义分析准确率仅有60%,机器无法及时理解并充分利用互联网中文信息,是困扰我国相关核心技术手段发展的根本原因。
孙教授向大家介绍了大数据条件下的自然语言处理,机器翻译、自动问答、纵横关联分析、群体智慧、知识图谱,应该如何通过机器阅读理解互联网,孙教授通过实例讲解了计算机自动作对联、云计算、Twitter应用。孙教授说,现阶段对于机器阅读互联网方面的技术存在很大局限性,并鼓励同学们努力学习,争取填补这一空白。
孙教授通过通俗的语言、精准的描述,深入浅出为大家讲解了大数据与自然语言的处理,
随后的互动环节孙茂松回答了同学的提问,并就相关问题与同学们展开了热烈讨论。
学生记者 邵思妤/摄

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。刘知远所在的实验室很不”高大上”。

《中国科学报》 (2019-04-22 第7版 能源化工.综合)

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。《麻省理工科技评论》用”知识指导的自然语言处理”来概括刘知远取得的成果,而他本人更精简地用三个关键词作了总结,那就是”语言””知识””学习”。

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。自监督学习让基于大规模无标记语料的语言模型得到了长足的发展。近期,
谷歌、百度分别提出了无监督文本的预训练语言模型bert、ernie,将自然语言处理任务的性能提升到新高度。百度提出的基于知识增强的ernie
模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。相较于谷歌
bert基于字单元的语义建模,ernie直接对先验语义知识单元进行建模,并通过海量文本数据学习实体间的语义关系。这种融合知识的语义建模大幅增强了模型语义表示能力,在包括语言推断、语义相似度、命名实体识别、情感分析、问答匹配等自然语言处理各类任务上的多个公开中文数据集上,ernie均取得了优于bert的效果。

首先是”语言”,指如何在人工智能的范畴,让计算机更好地理解自然语言,并且用自然语言与人类进行交流。

如何理解和运用自然语言,是人工智能需要解决的核心问题之一。当下,大数据、知识图谱、机器学习、深度学习等技术快速发展,并与自然语言处理密切结合,推动语言智能持续发展和突破,并越来越多地应用于各个行业。

不得不说,对于他本人来说,无论理论上的可行性有多大,只有看到成果做出来,他才能真正放下提着的心。而在松了一口气的同时,更令人期待的是,随着知识图谱构建得更全面,未来的提升空间是巨大的,有望在攀折自然语言处理这一高岭之花的路上留下浓墨重彩的一笔。

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。百度大脑是百度ai技术多年积累的集大成,包含语音、视觉、自然语言处理、知识图谱、深度学习等ai核心技术和ai开放平台。从2016年百度世界大会上宣布百度大脑完成基础能力搭建和核心技术初步开放,到2018年7月百度ai开发者大会发布百度大脑3.0,百度大脑已经构建起ai全栈技术布局,发展进入“多模态深度语义理解”阶段。在应用层面,百度大脑在全面支持百度业务的同时,全方位对外开放,通过赋能开发者和合作伙伴,发展ai技术生态,加速
ai 技术落地应用并与实体经济相融合,助力各行各业转型升级。

听上去像是在说绕口令,其实很好理解。所谓自然语言,就是人和人之间在交流时所使用的语言,是人类智能的集中体现,如汉语、英语、法语、德语等;而编程语言则是专门设计出来向计算机发出指令的语言,如Python语言等。对于刘知远来说,前者是目标,后者是手段。

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,百度已成长为以ai技术为重心的科技巨头。他提到,近年来深度学习的崛起及其与大数据的结合,使人工智能得到飞跃式的发展。在自然语言处理领域,深度学习模型具有比传统机器学习模型更强的数据学习能力,使得基于深度学习的依存句法分析等自然语言处理系统准确率得到大幅提升。目前,深度学习领域主要有强化学习、监督学习、无/自监督学习三种学习范式,而无/自监督学习可以类比人类学习,是一种重要的学习方式。

刘知远表示:”在高校做开源工具包的逻辑实际上与工业界有些不同,这些参与项目的高校学生往往都是自然语言处理研究一线的成员,梳理工具包的过程对学生不仅是一种锻炼,也让他们内心深处自然地多一分对这个项目的认同感,且能在这个过程中更深入、更全面地了解自然语言处理领域。不得不说,学生们很有潜力,他们最后做出来的成果也让我这个老师为他们感到自豪和骄傲。”

百度大脑扎实领先的技术实力,也在通过开放赋能深入与实体经济融合,服务各行各业和亿万用户。百度大脑已对外开放了160多项领先的ai能力,广泛应用于互联网、交通、工业、医疗、零售、金融等诸多领域。比如,在医疗领域,基于百度大脑能力打造的百度灵医,布局诊疗全流程,帮助提升诊疗效率,从而惠及更多患者;在农业领域,智能摇杆拍摄光谱可以借助图像识别技术精准估算不同田地的农药使用量,有针对性地施药杀虫,减少了用药浪费的情况,也更符合环保需求;工业应用方面,基于百度深度学习平台paddlepaddle打造的智能零件分拣机,分拣精度可达到90%,预测速度较同类产品快20%。同时,百度大脑与政府合作,如与雄安新区管委打造智能城市、与天津市政府打造“天津智港”等,提升公共服务和城市管理能力,让ai惠及大众。

从那以后,历经博士毕业,到2013年博士后出站留校任教,同时在孙教授领导的自然语言处理与社会人文计算实验室从事研究工作,二人的关系从师生变为同事,刘知远坦言深受导师的影响。”我的研究是孙老师带入门的。”刘知远很感激导师当时的耐心,”读博时期的第一篇学术论文是老师逐字逐句帮我修改的,当时其实他非常忙,但哪怕是课间那一点时间,他也会利用起来和我讨论论文的修改方向和注意事项。”

百度高级副总裁、ai技术平台体系和基础技术体系总负责人王海峰

“三无”本科生逆袭,不忘师恩

当然,自然语言理解技术也面临着数据稀疏、知识未被有效利用、结合场景的语用研究等挑战。但王海峰表示:“随着技术发展,我们会越来越深入地理解自然语言、掌握知识,推动人工智能发挥更大的价值,为人类社会发展提供更大的助力。”

作为清华人,刘知远的个人气质与清华的风格极为契合,一样的严谨踏实,信奉行胜于言,自强不息。明确研究方向之后,他不会夸夸其谈,只会依靠实际行动努力将目标变为现实。近几年,他一直在探索如何将已有的知识图谱嵌入到深层学习的模型中去,希望借此来打破该模型单纯由数据驱动的模式。

百度领先的语言与知识技术,不仅广泛应用于智能搜索、深度问答、对话系统、智能写作、机器翻译等领域,为广大用户提供更智能的体验,满足用户对信息和服务的需求,还通过百度大脑平台全面开放,促进行业应用和创新。

▲刘知远,清华大学计算机系自然语言处理与社会人文计算实验室副教授

中国电子学会科学技术奖是国内电子信息技术发展的风向标。作为新一轮科技革命和产业变革的重要驱动力量,人工智能正在给国家社会经济发展、社会生产关系变革和普通大众的日常生活带来深远影响。今年两会《政府工作报告》中首提“智能+”战略,各行各业也都掀起了运用人工智能技术推动创新发展的热潮。作为国内最早布局人工智能的企业之一,百度不断进行ai技术的研究探索和应用落地实践,并通过开放赋能,为推动ai技术应用和创新积极贡献力量。

就像你使用的iPhone的Siri似乎永远听不懂你在说什么,让你不得不放弃让它成为你的”朋友”。实际上,Siri听不懂”房间怎么像蒸笼一样”,
究其根本,是因为Siri并不能理解”房间像蒸笼”的意思。”对于我们来说,这句话很好理解,但其实牵涉到许多知识。首先是常识知识——’蒸笼’是什么?其次是逻辑知识——’像蒸笼’说明热,那就需要开空调;甚至更进一步的行业知识——空调厂商的股票或许会大涨。人类会在日常生活中潜移默化地得到许多知识,而人工智能不可以,所以它们很难理解我们的语义。”刘知远解释说。

在演讲结束后,王海峰还参与了“技术引领+产业引领”高峰对话,与中国工程院院士樊邦奎、中国电子科技集团公司首席科学家陆军、中科大信息科学技术学院执行院长吴枫教授、阿里巴巴技术委员会主席王坚等在内的学界、产业界人士,就人工智能技术如何推动和引领科技与产业发展进行了探讨。他表示,未来,百度还将持续发力,推动ai技术创新,为国家创新驱动发展战略和各行各业的智能化升级持续贡献力量。

当你问iPhone手机的语音助手Siri”房间怎么像蒸笼一样”,它只会”无言以对”地自行跳转到搜索网页界面,而绝不会”闻弦歌而知雅意”地问你是否需要打开空调,更不会心血来潮地吐槽”你衣服穿多了吧”。为什么会这样?究其根本,是因为Siri并不能理解”房间像蒸笼”的意思,它没有听懂你的话!

语言理解技术持续发展,并通过与知识图谱、深度学习等技术融合,正不断提高各种应用的智能化程度。王海峰在演讲中介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发了能够深刻理解用户意图、精准满足搜索需求、提供更丰富知识内容的智能搜索引擎,并结合语音、图像、增强现实等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。

图片 2

■苏超

第二个关键词”知识”泛指人类对物质世界及精神世界探索的结果总和。通常情况下,人和人之间进行交流时,其实在有意无意中掺杂了大量的知识。当A说”我们把香蕉给猴子,因为它们饿了”,”它们”指的是”猴子”;B说”我们把香蕉给猴子,因为它们熟透了”,这里的”它们”指代的是”香蕉”。人工智能可以分析出两句中的”它们”都是代词,但要更进一步地知道其指代的东西是什么,就必须结合人类的各种知识,了解猴子和香蕉的属性,融会贯通到自然语言处理的计算模型中,再形成深层次的推理和理解。

会上,百度高级副总裁、ai技术平台体系和基础技术体系总负责人王海峰发表以《语言与智能》为题的主旨演讲,结合语言与知识相关技术的发展变化,以及百度在相关技术领域创新和应用发展的经验,阐释语言与智能的关系及技术趋势。

图片 3

除了智能搜索方面的应用,百度还基于语言理解和生成技术提供智能写作等能力。智能写作适用于财经、体育、天气、热点与娱乐事件等多领域的辅助与自动写作,大幅提升创作效率。比如,基于结构化的股票数据,可以生成关于股市的快讯新闻。结合视觉技术的智能春联,可通过刷脸检测出人物性别、年龄、微笑程度、性格特征等,生成特征词,然后基于神经网络生成技术创作出应景的春联,让人工智能技术融入大众的文化娱乐生活。

从”深度学习”的名称中不难看出来,它必定与人类的神经网络有关。用刘知远的话说,”就像人脑里的神经元受到刺激会显示出激活和抑制的状态,我们希望将语义信息抽象成低维的向量,再将其投放入神经网络供人工智能感知学习。”因此,挑战在于如何将结构化符号表示的、离散的知识图谱信息嵌入到低维的向量空间中,用向量来表示。

智能客服是结合自然语言处理、知识图谱和语音等技术打造的行业解决方案。在智能客服场景中,基于语音语义一体化技术,百度大脑可以准确识别出用户的话语,理解用户意图,进而通过行业知识图谱的赋能理解业务流程,为用户提供相应的服务。整个服务过程流畅自然,实现了与用户无障碍沟通,提升业务效率并满足用户需求。

不难发现,刘知远所做的工作与现在传播甚广的深度学习有一个明显的区别。简单来说,现有的深度学习是一种数据驱动的模型。以机器翻译为例:计算机会在阅读大量翻译句段后学习词语的用法、组句的手法等,再去翻译成另一种语言,但它不会理解这句话到底是什么意思。而它们不理解的语义恰恰是刘知远追求的,他一再表示:”语言之所以被认为是人类智能的集大成者,绝不在于字面上的主语谓语宾语构成,或者词语之间的修饰关系,更重要的一定是语义——不仅是字面意思,还包括弦外之音。”

依托深度学习技术的发展,语音、图像等感知技术取得了巨大进步,但认知技术的突破会越来越依赖知识,需要提升对知识和大规模知识图谱的运用。在物理世界、人类社会和网络空间中,汇聚了大量的多元、异构、多模态的数据,百度借助无标签大数据开放域知识挖掘、知识体系自动扩展、知识整合等技术,基于海量数据构建起了超大规模知识图谱。目前,百度拥有世界上最大的多元异构知识图谱,除了包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱,针对不同的应用场景和知识形态,百度还建立起关注点图谱、行业知识图谱、poi图谱、事件图谱等多种知识图谱。比如在医疗领域,能够从病历等原始文本中,抽取出实体及多元关系,并进行文本结构化,最终构建起医疗图谱,同时结合医疗大数据、医疗认知计算,应用于医疗临床辅助决策服务中。

“曾经有人问我,我们提出的分布式表示模型是不是真的能帮助深度学习模型去理解和利用知识库中的信息。我想一切解释都不如实际成果来得直观:通过我们研发的算法,现有的大规模知识图谱以低维向量的表示形式被很好地纳入相关的深度学习模型中,进而切实提高了这些模型在知识指导的自然语言处理任务中的性能。”刘知远掷地有声地说道。

例如,用户用自然语言搜索“林徽因的丈夫的父亲是谁”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把答案“梁启超”精准呈现给用户。又如,用户搜索“上面草字头下面句子的句是什么字”,智能搜索引擎能够为用户提供“苟”的读音、笔画、释义等丰富的信息。

如果以年龄为界限来评价人生的成就,刘知远无疑应被划分到青年才俊的类别中,无他,入选《麻省理工科技评论》评选的”35岁以下科技创新35人”榜单即是证明。毕竟这个榜单每年只发布一期,由50位来自中国与全球顶尖学术研究单位、企业集团、投资机构重量级评委团及《麻省理工科技评论》中美编辑部经过缜密的评选程序,最后才甄选出一批35岁以下最具有创新性与影响力的科学家、科研工作者和科技创业者。历届获奖者中不乏后来成为领域内大佬的人物,如雅虎、谷歌、Facebook的创始人等。虽说此次评选不是世界级的,仅在中国范围内进行,但也足以能够证明刘知远的才华和创造力。

图片 4

科幻电影中经常有酷炫的人工智能亮相,如《流浪地球》中的领航员空间站核心智能主机MOSS,它在刘培强决定驾驶空间站去进行自杀式爆炸的时候说:”不能指望人类完全理性,那是不可能的。”抛开空间站、行星发动机等的设定,光MOSS的这一句话就展现了超越当下的科技水平。因为这是一句”吐槽”!一个会”吐槽”的人工智能意味着什么?这说明它真正理解刘培强的语言和举动,且有着强烈的价值判断能力。而目前的人工智能机器人顶多可以做到语音识别和命令理解,连语义理解都无比困难。

4月20日,第十四届中国电子信息技术年会上,“百度大脑核心技术及开放平台”荣获2018年度中国电子学会科学技术奖科技进步奖一等奖。评议认为,百度大脑突破了听觉、视觉和语言一体化的多模态语义理解技术难题,成果支持零门槛深度学习定制化训练和千亿特征的神经网络训练,打造了一个完整的人工智能技术开放体系,并通过统一人工智能开放平台向社会共享,带动了互联网行业技术创新,推动了传统行业的智能化转型。

多年与学生打交道的经历使他深深赞同因材施教的观点,盖因每个同学都有自己的特点。他回忆道:”比如说,有些同学的思维特别活跃,只要与他进行充分的交流和讨论,激发他的思维活力,他就可以找到既有科学价值自己又感兴趣的研究点。与之相对的,有些同学可能在创造性方面会弱一些,但动手能力强,基础知识扎实,那就要有针对性地去制定别的培养方案。”

多模态知识与语言、视觉等技术结合,发展进入“多模态深度语义理解”阶段。例如,基于知识图谱的视频理解技术,能够从视频中抽取结构化语义知识,真正“看懂”视频。

本科毕业时,非常幸运地,刘知远得以师从自然语言处理与社会人文计算实验室学科带头人孙茂松教授攻读博士。他曾在知乎上的一个回答中如此描述这段经历:”我本科属于’三无’人员,没有像样的科研经历和论文,没有程序设计竞赛经验,成绩也不突出,在年级和班级都排名1/3左右,所以特别感谢孙茂松老师接收了我。”

将现有知识图谱纳入深度学习模型

图片 5

若不是外面挂着的实验室牌子,记者会以为自己误入了一家互联网公司——眼前除了计算机还是计算机,上面飘着一行行看不懂的代码,不像别的学院有高精尖的仪器设备,看上去非常接地气。

如何让计算机听懂人话——让一位34岁的年轻学者兴致勃勃,他是清华大学计算机系自然语言处理与社会人文计算实验室副教授刘知远,第二批中国科协青年人才托举工程的入选者。

在刘知远的心中,孙教授是一个典型的中国知识分子的形象:勤奋严谨,求真务实,为人师表,言传身教,不外如是。

历尽天华成此景,人间万事出艰辛。依托于中国科协青年人才托举工程、国家自然科学基金面上项目等,刘知远所在团队在孙茂松教授的带领和指导下提出了一系列算法,并在2017年先后开源了两个工具包OpenNE(Open-Source
Network Embedding)和OpenKE(Open-Source Knowledge
Embedding),分别针对网络表示学习和知识表示学习进行了系统梳理。

“语言”和”知识”呼唤第三个关键词”学习”。知识是无穷无尽的,要让计算机用比较快速的方法学习到知识,就要让其自主地开展深度学习,自动化地把知识获取和知识应用不断拓展,因此学习的算法就显得无比重要。

刘知远的成就证明了他在自然语言处理方向上的天赋,然而这样一位年轻有为的研究者最初心仪的专业竟然不是计算机,用他的话来说,”高考改变命运呀!”刘知远”惋惜地”表示,”回想当年高考是山东首次施行3+X,理综考试超级简单,我却把最后一道大题的题意理解成更复杂的情形,痛失十多分,至今记忆犹新。于是,没能上成当时最热门的生物学专业,学了计算机。”

所幸,虽然来到计算机系就读是阴差阳错,但4年的本科生活让刘知远对该专业产生了浓厚的兴趣。他极为认可编程在从事重复性劳动方面的作用,青睐于更为自动化的人工智能方向。他这样描述人工智能的魅力:”这个年轻的学科有一个远大的目标——希望计算机像人一样思考,这个目标本身既是一个科学问题,如探究人类的智能究竟是什么,其形式化表示是怎样的;同时又是一个技术问题,即在探索过程中产生的算法等可以在现实世界不断应用,进而改变社会的方方面面。例如在追寻利用自然语言与计算机交互的终极目标过程中开发的语义相关度技术,已经广泛应用在搜索引擎中,在浩如烟海的网页中寻找与被查询关键词关联度最高的内容。”

谈及人工智能自然语言处理(natural language
processing,简称”NLP”)的话题,刘知远显得兴致勃勃。这不难理解,毕竟他不仅是第二批中国科协青年人才托举工程的入选者,还在今年年初凭借”知识指导的自然语言处理”入选了《麻省理工科技评论》组织评选的第二届中国区”35岁以下科技创新35人”榜单,荣获”先锋者”称号。

非常有趣的是,就在刘知远师从孙教授不久,他自己也成为了大一新生们的老师——辅导员。毕业后他又在实验里与老师们联合培养学生,一直承担着教学科研和指导学生的工作。他认为这几件事之间是相辅相成的关系,”因为做科研本身就是一个带学生,培养他们成才的过程”。与大多数教师相同,刘知远面对学生时也是满怀拳拳之意,希望能够充分尊重学生们的发展模式,发挥他们的优势,让他们一步一步地成长为领域内的栋梁之才。

向”弦外之音”发起挑战,让计算机自主学习

依托这两个开源工具包,这支由孙茂松教授领导、刘洋副教授与刘知远副教授协同,共有20余名研究生、访问学者和访问学生的团队成功发布了世界上两个比较知名的、开放的知识图谱的分布式表示模型,证明了将大规模知识图谱嵌入到深度学习模型中的可行性,在知识指导的自然语言处理方向上交出了精彩的阶段性答卷。

听不懂人话,计算机让人崩溃

“这并不奇怪,我们的工作其实和程序员有些类似,不管是开发算法还是开源工具包,都得跟计算机打交道。”刘知远幽默地说到,”我们想让人工智能理解自然语言,就必须利用编程语言开发算法去实现。”

“所谓’知识指导的自然语言处理’就是这样一个整体,指的是如何用知识去驱动计算机的相关算法,从而更好地实现自然语言的理解和生成,让计算机在指令工作的模式之外,真正与人进行深层次的交流。”刘知远补充说,”这就是我一直在做的工作。”

相关文章