10月25日-26日,由清科集团、投资界、新芽NewSeed举办的“2017V武林大会”在北京召开。 从“少有人做的事”,到“全民创业”,V50陪伴创业者们跋涉了十二年。2017 V计划,汇聚最具代表性的创客及投资大佬,解读最尖端的技术、分享最前瞻商业模式、展示最摩登的产品,最具投资价值企业巅峰对决,探讨浪潮之中与浪潮之外的创业、投资机会。
会上,Drive.ai联合创始人王弢先生带来了以《智能撬动未来》为主题发表了演讲,他表示:
1、人工智能不是什么魔法,本质上是科学和工程学的结合,有它自己内在的规律,它早已和我们的生活息息相关了。
2、人工智能发展历经了四个时期,两次大起大落后才迎来了这个时代的大繁荣。
3、当今支撑人工智能发展的四大支柱:算法、数据、硬件基础和软件框架。
4、对于人工智能的未来,可能会有新的突破。从创业方面来看,具有实际需求,数据收集和标注成本较低的行业,比较容易有AI人工智能的突破。
以下为演讲实录,经新芽NewSeed(ID:pelink)编辑:
我是Drive.ai联合创始人王弢,我们Drive.ai是一家位于硅谷的创业公司,我们的团队致力于建造L4级的无人驾驶技术,用深度学习和人工智能打造无人驾驶的大脑。
非常容幸今天能够受邀参加这次大会,作为主题演讲的演讲人,主题演讲的题目是智能撬动未来。今天在科技界,大家说到智能,一般都是指的人工智能,英文叫Artificial Intelligence,缩写是AI。
那么人工智能的定义究竟是什么呢?
其实人工智能这个概念,最早出现于1955年达特茅斯学院举办的一次夏季科技会议上,当时著名的计算机科学家约翰麦卡锡教授提出了人工智能是制造智能机器的科学与工程。后来普遍人们就认为人工智能诞生于这一次1955年的达特茅斯会议,而1955年也就成为了人工智能的元年。
就在昨天10月24日,是麦卡锡教授逝世6周年的日子,今天我在这里就以这篇演讲来缅怀这位人工智能领域的先驱。
我今天的演讲分为四个部分,首先解释一下何为人工智能,人工智能与我们的生活有什么关系。第二,人工智能发展的历程,第三,人工智能的四大支柱,以及最后我会简单展望一下人工智能的未来。
一、什么是人工智能?它与我们的生活有何关系?
人工智能的定义,大特貌似会议提出来了,但是人工智能跟我们普通人又有什么关系呢?人工智能是科幻电影里面那些让人印象深刻的角色,还是电视节目中那些无所不能的,可以击败人类冠军的,人类专家的这些电脑程序和机器人,其实我要说的是人工智能早就和我们的生活息息相关了,人工智能早就无处不在了。试想一下,上网使用的搜索引擎,手机上使用的个人语音助手、手写输入法、地图导航、机器翻译系统,网购时候使用的推荐活动,都用到了大量的人工智能技术还有一些人工智能的技术和程序,在默默无闻的发挥着关键的作用,比如说在金融领域的反欺诈,网络安全和病毒查杀,还有公共安全和安防监控等。
在研究人工智能人的眼中,AI又是什么样子的呢?其实这就是我读研的时候每天看的,有时候看得都觉得头大,这就回到了麦卡锡教授提到的这个定义上来,人工智能不是什么魔法,本质上是科学和工程学的结合,有它自己内在的规律。中国人讲究以史为鉴,想要预测一件事情未来发展的趋势,往往最好的方法就是看一看它的过去,并试图最终总结出一些规律来。所以今天在谈未来之前,我就简单回顾一下这60年来人工智能走过的发展历程。
二、人工智能发展的历程
首先1950年著名的英国计算机科学家图灵提出了图灵测试,简单来说图灵认为机器在某些事情上面模仿人类能够做到以假乱真了,我们就可以认为机器在这件事情上跟人类一样有思考能力了。虽然这不是图灵的本意,但是后来人们就大量使用图灵测试,来判断在某一件事上人工智能是否已经够聪明,已经够强了。
1955年达特茅斯会议之后的几年之内,人工智能迎来了第一次发展的高峰,这一时期的算法研究主要由政府拨款资助,在内容上注重算法、数学与逻辑上的完整性和正确性。著名的感知器,后来也成为了深度学习的基石之一,也是在这个时期被发明的。可是当时整个社会,尤其是美国社会,对于人工智能的期望值过高,当研究遇到一些瓶颈的时候,人们的希望就转换成了失望,随之而来就是第一次低谷。这一时期人们发现当时的计算能力仍然不能足以解决实际生活中的问题,而当时的数据量不足,也就制约了这些算法的进一步发展。
接下来一直到了1980年代,AI学界痛定思定,认为光有算法,光在数学上证明这个算法有多完美还是不够的,要让AI发挥实际深入中的作用,还是要使它能够接触到人类的专业知识,一类名叫专业系统的AI就应运而生,这张图显示的就是当时的专家系统普遍使用的通用型计算机。专家系统可以说是AI在商业领域的第一次成功落地,设计简单和又实用,往往是专用于某一个非常细分的领域,比如说分辨某两种化学试剂,或者是诊断一种特定的疾病,由于适用性得到了各大公司的接受。可是好景不长,很快IBM和苹果生产的台式机性能就超过了通用型计算机。日本第五代计算机工程也并未实现预期的目标,随之而来就是经费的缩减,也就造成了第二次AI的低谷。
一直到了90年代,我们才迎来了这一轮的AI大发展,90年代由于数据量的增多,和因特尔互联网的普及,统计学的模型受到了亲睐,AI学界不再依赖于人类的经验知识来给AI程序规定一些规则,而是试图从数据当中去学习对实际问题进行建模。90年代的时候,IBM的深蓝击败了国际象棋冠军卡斯特罗副……这成为了当时AI发展的一次标志性的事件,而2010年前后,深度学习开始崛起,并在各类测试上接近或者是打败人类的表现,直到最近两年AlphaGo也是接连击败了围棋冠军李世石和柯洁。从此在棋类游戏上面,可以说AI已经一骑绝尘,远远把人类甩在了后面。
三、人工智能的四大支柱
说到这里,可能大家会有两个疑问:
第一,既然AI有过两次大起大落,我们如何保证这一次的大繁荣向前两次的昙花一现;
第二,我们也注意到有一些深度学习的基本模块,像卷积神经网络,反向传播的算法,感知器都是在数十年都已经发明的,为什么直到2010年的前后才大放异彩呢?
要解释这两个问题,我们就要从当今支撑人工智能发展的四大支柱。这四大支柱是算法、数据、硬件基础和软件框架,现在就一个一个讲一下。
算法:虽然说深度学习的基本架构,也就是多层的神经网络,它不是一个新生的事物,也是数十年已经发明的,但是AI学界一直对于这个算法,包括神经结构的连接,和训练的方法进行不断的创新,同样的趋势也出现在语音识别准确度上面,09年微软研究院在语音识别上面使用了LSTN,此后AI的表现在语音识别上面也已经接近人类了。
数据:有了这个算法,其实还是不够的,我们知道深度学习它是需要非常多的数据来进行驱动的,进行训练的。那么在90年代初的时候,如果你想要训练一个多层的神经网络,学界可能会不屑一顾,会嘲笑你,说你这个系统很快就会出现过冗余的现象,在训练上数据上面还可以,但是完全没有办法泛化。
今天处在一个数据爆炸的时代,互联网上的每一秒产生的数据就有两万个G之多,如果说深度学习是一架高性能的引擎,源源不断的数据就是驱动这驾引擎的原料。有了这么多的数据,我们总得有地方放,这个时候硬件的问题就来了,90年的时候,大家还记得这个3.5寸盘,如果要存一个G的数据,用它来存,估计要花一万美元,今天一个G的数据,对于我们来说简直就是小儿科,随着很多云服务的出现,数据储存的成本越来越去趋近于零,可靠性也就越来越高。
硬件基础:还有一方面就是算例,说到深度学习上面的算例,不得不提一个事物叫GPU,也就是说图形处理器。图形处理器不同于一般的中央处理器,一般中央处理器可以说就是十几,或者几十个核心,图形处理器有成千上万个微小的核心,每个核心不算强大,但是它们合在一起就有了强大的并行计算能力。特别适合用来渲染3D游戏当中的一些场景,也得到了很多游戏玩家的追捧,撑起了整个GPU的行业。AI的研究者也发现GPU恰巧能够用来加速深度学习的训练,以前需要几天,甚至几个星期才能训练好的模型,现在只需要几个小时就能训练好了,大大加快了AI发展的迭代速度,可以说这些骨灰级的游戏玩家,用自己的钱包推动了人类的发展。
软件框架:记得我在斯坦福读研的时候,自己写深度学习的算法,而且一行一行去写反向传播当中的导数,数学的原则并不复杂,但是很繁琐,写错一个就要纠错纠半天,现在如果想学习深度学习,或者是应用,就容易多了,有各种各样的软件框架和编程语言供你选择,使得更多的程序员和开发者加入到这个行业中来。
四、对人工智能未来的展望
下面我说一下人工智能的未来,我不是预言家,也不敢做大胆的预测,在这里我就想讲一下我自己觉得很有趣,可能有新突破的领域。
首先深度强化学习,比深度学习多了两个字,深度学习对于数学的要求是非常高的,没有大量标注的高质量的数据,是训练不出好的模型的,为了突破这个数据瓶颈,学界就发明了一种叫深度强化学习的方法。它的原则就是在一些已经设定规则的特定环境当中,让AI自行进行探索或者是获得奖励,玩游戏的时候可以把这个分数作为一种奖励,从而去学习,进行长期的规划。比如说可以玩一些比较简单的游戏,像吃豆子,也可以玩比较复杂的游戏,比如说星际争霸2。实际生活中还可以用来训练机器手抓起物体,最近有一个大新闻,AlphaGo Zero在不看人类棋谱的情况下,与自己对战进行学习,最终玩虐了第一个版本的AlphaGo,其中用的就是强化深度学习的原则。
第二个是艺术创作,大家会觉得有点惊讶,说AI之前并不看好在艺术创作上面会有所突破和发展,毕竟AI是机器,不可能像人一样有艺术细胞,现在事情正在发生改变,比如说有一类的深度神经网络,可以把一张图上的细节和风格,转移到另一张完全不相干的图上,我们就让AI,让梵高穿越时空,给斯坦福的活佛塔画了一幅肖像,以后自拍和做美颜就过时了,可能会选择梵高,米开朗基罗等。也许你会说这是一个高级的滤镜,没有什么了不起的,我们来听下面这两段音乐。
虽然有这么一点点的零乱,还算是别具一格,这两段音乐是由创造了AlphaGo公司所推出的一个叫Wavenet人工智能的程序,自主生产的,没有经过人类的干预。
对于人工智能未来应用的展望,我想说的是人工智能的四大支柱,四驾马车都在高速的增长,目前没有看到衰退的势头,但是大家不用担心,像天网有自我意识的强智能在短期内是不会出现的,但是AI在很多专业的领域会有大的突破。在创业方面,我觉得有实际需求,数据收集和标注成本较低的行业,比较容易有AI人工智能的突破,比如说机器翻译,自动化生产,智能监控,还有自动驾驶,也是Drive.ai目前也在致力于推进的。
人工智能在过去60年的时间里,已经深刻改变了这个世界,我们每个人都已经和人工智能分不开了,那么在未来我相信人工智能将继续在各个领域发挥它巨大的影响。
也许2030年的某一天,你下班后坐在汽车里,欣赏着窗外的蓝天白云,绿树荫荫,车里没有方向盘,也没有驾驶员。环境污染和交通拥堵已经随着人工智能交通和自动驾驶的普及,一去不复返了。这个时候车里的智能系统根据你当时的心情,调节出了一首音乐,正是你当时想听的由AI和人类作曲家共同完成的一首曲子,那个时候的音乐会是什么样子呢,让我们去侧耳聆听吧。谢谢!