本篇文章7568字,读完约19分钟
在阿尔法戈赢得与韩国围棋手李世石的战斗三年后,一些迹象逐渐显现。张谦院士认为时机合适,接受了采访。
张倩,计算机科学与技术专家,俄罗斯自然科学院外籍院士,中国科学院院士,清华大学教授,博士生导师,现任清华大学人工智能研究所所长。
深度学习是目前人工智能最关心的领域,但它不是人工智能的全部研究。张骞认为,尽管空仍处于工业水平,但基于深度学习的人工智能在技术上已经达到了极限。这条技术路线带来的“奇迹”在阿尔法戈获胜后没有再出现,估计未来很难继续大量出现。技术上的改进很难完全解决目前人工智能的根本缺陷,而这些缺陷决定了其应用空限于特定领域——其中大部分集中在图像识别和语音识别上。
同时,在张谦看来,商业界和世界上一些学术界对深度学习技术的判断过于乐观,迫切需要将人工智能推向一个新的阶段,这注定是一个漫长的过程,这就需要依靠数学和脑科学的结合来实现基础理论的突破。
张倩作为一个经历了人工智能技术两个阶段的国内罕见的研究者,在过去的几年里很少接受采访。其中一个原因是他对人工智能技术目前发展状况的估计持有一些不同的观点。在此之前,张諾谨慎地认为,这些观点不便于通过大众媒体传播,即使传播,也难以得到认同。
“现在,我们可以在许多方面看得很清楚,而且一些迹象已经出现了。现在我接触了很多企业,跟我谈这个问题,这说明企业在一线发现了很多问题,所以我只是想找个机会谈一谈。”
首先,“奇迹没有发生,而且根据我的估计,它不会继续大量发生。”
近三年来,人工智能的关注主要来自于其在围棋领域超越人类的“奇迹”,人工智能一次又一次地证明了人类“围棋智慧”的优越脆弱性。
容易被忽视的是,围棋虽然复杂多变,但与纸牌游戏相比,围棋规则简单,信息完整,这正是人工智能目前擅长的。
在张谦看来,虽然在前些年,人工智能在语音识别、图像识别和围棋中出现了“奇迹”,但从那以后,这一“奇迹”并没有出现在其他领域,其技术应用的界限和条件也逐渐清晰。
经济观察家:你如何估计和评估人工智能的当前发展?
张倩:这一波人工智能始于本世纪初。首先,它出现在学术界。过去,学术界对人工智能冷遇,但多层神经网络的出现带来了一些变化。神经网络理论产生于20世纪50年代,但它一直处于一种肤浅的应用状态,人们认为多层不会带来任何新的变化。
真正引起大家注意的是斯坦福在2012年的实验(注:2012年,谷歌和斯坦福使用多层神经网络和大量数据进行图像识别实验)。在过去,实验中图像样本的数量最多是“10,000”,斯坦福用了1,000万。利用多层神经网络进行识别,发现该模型在人脸、人体和猫脸三类图像中的识别率约为7%-10%
这给了大家一个很大的震动,因为通常识别率应该提高1%。现在它只是增加了层数,并且发生了两大变化。一是识别率提高了很多;第二是能够处理如此大的数据。这两个变化极大地鼓舞了每个人,尤其是在2012年之前,人工智能没有解决实际问题。
《经济观察报》:这一突破的原因是什么?
张倩:现在有三个原因,大家都很清楚。一是大数据,二是计算能力,三是算法。意识到这一点后,深学在一夜之间震惊了业界和外界,接着发生了三件历史性的事件。
首先,2015年12月,微软通过一个152层的深层网络将图像识别错误率降至3.57%,低于5.1%的人为错误率;第二件事,微软在2016年完成的语音识别,单词错误率为5.9%,与专业速记员的水平相当;第三件事:阿尔法哥打败韩国围棋手李世石。
通过人工智能,使用深度学习和大数据这两种工具,我们可以在特定条件下和特定领域超越人类。这三件事给了每个人很大的鼓励。
尤其是对于业外人士来说,他们认为只要我掌握了大数据,我就有可能通过深入学习创造奇迹,所以我们做了很多预测,比如计算机在任何方面多久会超过人类。
但事实上,在这之后,奇迹并没有发生,而且根据我的估计,它们在未来也不会大量发生。确切地说,未来可能会在个别领域取得进展,但不会像以前预测的那样全面发展。特别是,中国市场乐观地认为“中国有一个巨大的市场,有大量的数据和无限的使用,所以奇迹一定会在中国的未来发生。”
因此,许多企业发现在这样做时情况并非如此。从目前的情况来看,最好的东西是图像识别和语音识别。我看了看。中国人工智能领域的20家独角兽企业和30家准独角兽企业中,近80%与图像识别或语音识别相关。
《经济观察报》:为什么会这样?或者经过这么长时间,我们对人工智能目前能做什么有一个清晰的认识吗?
张倩:这种恐慌发生在人工智能在《围棋》中击败人类之后。“一个大师能做的事情可以通过人工智能来完成。我的工作太普通了,肯定会被机器取代的。”。这里我们需要考虑它的局限性。我一直在说在各种会议上不要过于乐观。
人工智能能做的三件事(语音识别、图像识别和围棋)是因为它满足五个条件,也就是说,只要这五个条件都满足,计算机就能做好,只要有一个或多个条件不满足,计算机就很难做好。
首先是必须有足够的数据,这意味着不仅数量大,而且多样性,不完整等等。
第二是确定性。
第三个是最重要的,它需要完整的信息。围棋是完全信息的游戏,而纸牌是不完全信息的游戏。尽管围棋很复杂,但它本质上只需要快速计算,不依赖于智能。然而,在日常生活中,我们所有的决定都是在不完全信息下做出的。
第四个是静态的,包括根据确定性法则的进化,这是可预测性的问题。复杂路况下的自动驾驶不符合这一要求;事实上,它既不满足于确定性,也不满足于完整的信息。
第五是具体领域。如果场地太宽,他就做不到。人工智能软件只有一个任务,那就是下棋,不能做别的事情。
经济观察:也就是说,在满足这五个条件的前提下,目前的人工智能是否有资格胜任某些工作?
张倩:如果你的作品符合这五个条件,它肯定会被电脑取代。符合这五个条件的工作特点是显而易见的,即“按规矩办事”四个字不需要灵活性,如出纳和出纳。如果你的工作是灵活的和创造性的,计算机完全不可能取代它。当然,有可能部分替换它,因为必须有一些简单和重复的内容。如果我们认识到这篇文章,我们就会意识到人工智能仍处于发展的早期阶段。并不像有些人估计的那样,“人工智能技术已经完全成熟,进入了开发和应用阶段。”
第二,“从应用角度来看,深度学习技术已接近极限。”
本世纪第二个十年的人工智能活动得益于建立在神经网络基础上的深度学习领域的突破,神经网络的概念诞生于20世纪50年代研究者对人类脑神经系统的研究和模拟。
在过去的30年里,数学的突破,特别是概率论和统计学的突破,为多层神经网络的登陆提供了基础——它们为多层神经网络和海量数据处理提供了有效的数学工具,但同时,“黑箱”学习方法已经成为深度学习的缺陷之一:即使人工智能能够给出正确的选择,人们也不知道它给出答案的依据是什么,人们也无法理解这种新的智能,因为他们相互理解。
图灵奖获得者朱迪亚·珀尔指出,尽管深度学习算法有大脑的启发,但它们也可以被视为另一种强大的数据分析工具,即“曲线拟合”。诺贝尔经济学奖得主托马斯·萨金特认为人工智能实际上就是统计学。
那么,人们需要机器来解释吗?
经济观察家:我们应该如何定义深度学习技术的当前路线?它是基于概率的吗?
张谦:深度学习的本质是基于概率统计。什么是概率统计?不那么神秘,深刻的学习是发现那些重复出现的模式,所以它被认为是一个规律(真理)当重复多次,所以它被认为是一个真理当一个谎言被重复一千次,那么为什么大数据有时会产生荒谬的结果,因为不管它是对还是错,只要它被重复多次,它就会遵循这个规律,也就是说,谁说得多谁就是谁。
我经常说,我们还没有进入人工智能的核心问题。事实上,人工智能的核心是知识表示和不确定性推理,因为人类智能的源泉在哪里?就知识、经验和推理能力而言,这是人类理性的基础。如今,人工智能系统非常脆弱,容易受到攻击或欺骗,需要大量的数据,并且无法解释,并且具有非常严重的缺陷,这些缺陷是必不可少的,并且是由它们的方法本身造成的。
《经济观察报》:也就是说,不能通过改善来彻底解决?例如,如果我们增加神经网络的数量和复杂性或者增加数据量,它能解决它的缺陷吗?
张倩:改善是不可能的。深度学习的本质是利用概率学习的“黑箱”处理方法,利用未处理的数据找出其规律。这种方法本身通常找不到“有意义的”规律,但它只能找到重复出现的模式。也就是说,你不能仅仅依靠数据来获得真正的智慧。
另外,深度学习目前只是人工智能技术的一部分,人工智能需要在更大更广的领域进行研究,如知识表示、不确定性处理、人机交互等。不能说深度学习是人工智能,但深度学习只是人工智能的一部分。直到去年,在人工智能会议上交换的论文中有三分之一是关于机器学习的,三分之二是关于其他方面的。
《经济观察报》:学术界对此还有清晰的认识吗?
张伟:我可以说,世界上大多数学术界都有一个清晰的认识;世界上大多数商业圈都持有过于乐观的估计。
为什么会这样?因为大多数从事早期人工智能研究的人已经死亡或年老,没有说话的权利。如今,那些活跃在人工智能研究第一线的人都是在深度学习和大数据兴起后加入进来的,他们对人工智能的理解还不够全面。
《经济观察报》:如果每条技术路线都有“技术潜力”,我们在深度学习中使用了多少这种潜力?
张倩:科学研究很难准确估计,但如果从应用的角度来看,深入的学习并不能改变它,我认为它已经接近了极限,这意味着你不太可能再创造奇迹。
《经济观察报》:基于此,商业公司在底层技术和产业的应用方面还有很大的空空间吗?
张骞:只要我们选择合适的应用场景,使用成熟的人工智能技术来做应用,还是有很大的空空间的。目前,为了克服深度学习中存在的问题,学术界正在进行深入的研究工作。我们希望商界,特别是中小型企业,应密切关注研究工作的进展,并及时将新技术应用于其产品。当然,像谷歌和英美烟草这样的公司将做相关的研究工作,他们将把研究、开发和应用结合起来。
《经济观察报》:有一种观点认为,我们强调的“白盒”(可理解性)实际上是从人们的思维中强调出来的,但它实际上是通过大数据和概率统计工具进行的机器思维,你不一定需要它给你一个解释,只是一个正确的答案。
张倩:目前有两种意见。一种观点认为通向智能的道路有很多,不仅一条道路可以通向智能,而且我们已经通过自然进化产生了自然智能,那么为什么我们不能通过机器产生机器智能呢?这种智能与自然智能并不完全相同。条条大路通罗马,我们通过自然进化获得的智慧不一定是最好的。我同意这个观点。机器智能不同于人类,但它实际上是有益的。它可以相互补充,充分发挥各自的优势。
但从长远来看,我们必须走人类智慧之路。为什么?因为我们想发展人机合作和人机和谐共处的世界。我们并不是说在未来,一切都将由机器来管理,由人类来享受。我们应该走人机共生的道路,这样机器的智能就必须和人类的一样,否则我们就不能共存,我们就不能理解机器在做什么,我们的意图就不为机器所知。两者如何合作?
经济观察家:必须是可解释的?
张倩:是的,它是可以翻译的。你想让它做出决定。如果你不明白,就让它飞吧。谁敢乘坐这架飞机?因此,在现阶段,汽车和飞机不能完全让机器来驾驶。为什么我们可以放心,司机就坐在上面?因为我们和他有着相同的命运,我们必须一个接一个地杀人。这台机器和你的命运不一样。它不能被杀死,但是你被杀死了。
有些人认为这个问题非常脱离实际,这是错误的。人类怎么能开发出那样的机器?人类不会那样发展。有些人担心机器人在那里统治人类。我说这只能被认为是一个长期问题。
经济观察家:所以图灵的论文也说这个观点“不值得反驳”。
张倩:是的,这是一个长期的问题。目前我们仍有许多近忧。要发展人工智能,我们必须考虑安全问题,这已经是一个现实的问题。
看看语音合成,利用现有的技术,我们可以做出真实的东西,这基本上与真实的人没有什么不同。现在看来,这项技术是不能推广和应用的,因为一旦推广,就会完全失灵。只要用语音合成技术制作的假录音被制作出来,任何名人都会被毁掉。这些都是非常危险的技术。人工智能的治理已经提上日程。
第三,“我们不能训练爱因斯坦和图灵。”
人工智能在中国市场的迅速商业化吸引了各类研究人员的参与,中国研究人员在发表论文数和平均被引次数两个指标上表现出了竞争力。一种乐观的观点认为,“中国的人工智能研究已经可以与美国并列。”
对此,张谦院士谨慎地认为,虽然中国的人工智能在工程和产业化方面已接近世界水平,但在技术创新方面与世界水平仍有很大差距。事实上,迄今为止,几乎所有人工智能的原始研究成果都来自美国。
作为中国人工智能研究的领先机构,清华大学也在努力改善这种状况。5月18日在清华大学成立的“人工智能学校班”(以下简称“智能班”)就是其中一项举措。智滨的目标是培养在人工智能领域引领世界的顶尖科研创新人才,为未来一二十年的人工智能技术发展储备中国的顶尖人才。智办将从2019年秋季开始招收本科生,首批学生预计将招收30人。清华大学跨学科研究所所长、图灵奖获得者姚期智院士将担任知班首席教授。
“基于这一原则,我们在清华开设了人工智能课程。几十年前,中国失去了一些与其他国家同时起步的机会。我认为我们现在有一个非常好的机会。姚期智说:“当人工智能将在未来10年或20年改变世界时,我们应该与他人同时开始,甚至领先他人一步,培养我们的才能并从事我们的研究。”
清华大学副校长、院长杨斌教授在招生信息交流大会上的开幕词中,将清华大学“人工智能”一词所蕴含的人才培养理念进行了解构。他围绕“人”阐述了清华大学的“三位一体”教育理念,即成人在群体中成才,人才第一,为国家培养人才。围绕“工作”,本文描述了清华人谋生、善于谋生、乐此不疲的工匠精神,以及追求做一流职业的境界;本文以“智力”为中心,阐释了清华跳出“发展只能衡量”的怪圈,重视教育价值自由的思想;围绕“能”,描绘了一代又一代勇于承担责任、积极奉献的清华人的主人翁姿态,以及可靠、愿意、值得信赖的风格特征。
《经济观察报》:有一种观点认为,中国拥有更多的数据和工程师,这种规模可以逆转基础研究的突破,或者决定技术路线?
张倩:这里有很多混淆的概念,比如科学、技术、工程。科学技术水平需要用三个标准来衡量,一是科学研究水平,二是技术水平,三是工程实践或产业化能力。
中国的情况如何?从工程的角度来看,我们在某些领域“接近世界水平”;我用技术水平这个词是“大差距”,因为很多事情都是外国做的,我们不会做;我在科研领域用的词是“大差距”,而科研就是原创。事实上,人工智能领域的所有原创成果都是美国人创造的。人工智能领域有11名图灵奖获得者,10名美国人和1名加拿大人。
《经济观察报》:数据显示,中国人工智能领域发表和引用的论文数量已进入前列。这是否意味着中国人工智能科学领域的突破?
张谦:单从论文的研究水平来看,基本上体现在三个指标上:论文的数量、平均被引率和最高被引率。就人工智能而言,中国研究人员论文的数量和平均被引率都不差,但单篇论文的最高被引率与世界有很大差距,这个指标正好反映了你的原创能力。
也就是说,在深度学习领域,我们的平均水平已经达到了世界水平,但是与世界最高水平还有很大的差距。然而,我们必须确保我们的应用程序发展迅速。
《经济观察报》:清华在这方面有什么优势吗?
张谦:在人工智能的重要会议期刊中,近十年来论文的数量和平均质量分别位居卡内基梅隆大学和清华大学的第一和第二位。我们培养的是计算机领域的世界级人才,清华的本科生和博士生。
目前,我们的跟踪能力比较强。一旦有人开始,我们可以很快跟上。但不幸的是,我们缺少顶尖人才,无法培养顶尖人才,比如爱因斯坦和图灵。
就我个人而言,我认为原因之一可能与中国文化有关。我们的从众心理非常严重。例如,在人工智能领域,深度学习非常热门。几乎70%的发表论文的作者是中国人,但在其他非热门领域,包括不确定推理和知识表示,几乎没有中国作者。这是随大流,不愿探索“无人之地”。
当然,不要着急。科学研究是富人做的事情,也是富人做的事情。我们仍然是发展中国家。科学研究的起点相对较低,暂时落后是不可避免的。我们会赶上的。
第四,“低潮会发生,但不会像过去那样。”
张倩:现有的深度学习技术已经达到了顶峰,似乎很难发展。但这并不意味着我们不能朝着新的方向发展,不能在此基础上走出一条新的发展道路。事实上,这项研究正在进行中。
张忠院士倡导第三代人工智能。根据目前的假设,新的技术路线应该解决现有的缺陷,如不理解和脆弱性,这可能需要结合和突破计算机科学,数学和脑科学。
在上个世纪,由于技术方向的原因,人工智能技术也经历了一个漫长的低潮期。我们将来会再次经历这个过程吗?
经济观察家:如果深度学习已经进入了极限,人工智能的未来方向将会是什么?
张倩:最近我们要提出一个新概念,那就是第三代人工智能的概念。人工智能实际上经历了两代人。第一代是符号推理,第二代是当前的概率学习(或深度学习)。我们认为我们现在正在进入第三代人工智能。原因显而易见。第一代和第二代都有很大的局限性。
经济观察:你提到的第三代人工智能技术有明确的实现方向或特点吗?
张谦:我们现在提出的是建立一个可解释的、健壮的人工智能理论和方法,开发一种安全、可靠、可信的人工智能技术。
经济观察:这样的技术可能要等很长时间?
张倩:是的,很难预测,我们赶时间。
经济观察家:回归有必要在理论层面寻找新的方法吗,比如数学?
张倩:目前我们有两种方法,一种是和数学结合,另一种是和脑科学结合。如果你没有新的数学工具和受到脑科学启发的新想法,你能从哪里得到新的理论?另一方面,有必要将数据驱动和知识驱动结合起来,因为很难在数学和脑科学上寻求突破,而前者现在可以做到。
《经济观察报》:这种结合是指过去几十年人工智能经验的整合?
张倩:是的,至少有一个方向是第一代和第二代结合起来,发挥各自的优势。然而,很难将这两者结合起来,因为它们在不同的空运作,一个是向量空,另一个是符号空,这也需要新的数学
经济观察家:纵观人工智能的历史,每一代技术之间都有很长的间隔。第三代人工智能技术会是这样吗?
张倩:我想时间会更长,因为要解决关键问题,因为遇到的问题比较困难。
《经济观察报》:再过10年或20年,人工智能将成为学术界或公众心目中的“隐性研究”,就像20世纪70年代和80年代一样,公众将不再频繁提及这个词。
张倩:会有低潮,但不会像过去那样了。为什么?由于大数据、互联网和强大的计算资源,所有这些都将支持人工智能继续发展,尽管有时这只是表面的繁荣。
来源:人民视窗网
标题:张钹:AI奇迹短期难再现 深度学习技术潜力已近天花板
地址:http://www.rm19.com/xbzx/34725.html