搜索
当前位置:首页 > 观察详情
趋势 | 探索大数据 迎接人工智能时代
作者: 作者单位:信息化时代 所属类别: 2018-12-04 13:55:18 浏览:211
  现在这个时代已经从大数据时代,迈入人工智能时代。大数据本身的规模特别大,从原来的EB级正在往ZB级发展,数据本身在不停地增加,我们叫数据泛滥。数据是不是越大越好,是不是什么东西都一定要有数据?回答是No。AlphaGo下围棋,以前需要使用人类下围棋的数据,最近的AlphaGo Zero不需要人类对弈数据了,自己会生产数据。
  满足三个条件机器一定赢
  什么样的情况不需要外部数据,自己生产数据就够了?什么样的AI系统不需要外部数据就可以战胜人,实际上要满足三个条件:第一,集合是封闭的,不管你是状态集还是什么集,你的集合是封闭的,我们知道围棋集合是封闭的。第二,规则是完备的。下棋什么地方能下,什么地方不能下,这个规则是完全完备的,不能随便更改。第三,约束是有限的,你在约束条件下,不可以递规,因为有了递规之后往下推延就停不下来,而有限的时候就能停下来。
  满足这三个条件,不需要外部数据,系统自己产生数据就够了。满足这三个条件机器一定赢,不管德扑、围棋,类似的情况很多了。
  现在很多的交易、物流、零售,其实它有很多的条件一直在变,不满足一定的条件,这时候需要很多外部的数据,外部数据怎么用?它自己不会产生用法,这个用法需要靠人,通过人工智能的手段,去使用这些数据。人工智能实际上就是从大数据科学到人工智能,这是非常自然的迁移过程。
  人工智能60年的发展实际上经历了三个阶段,第一个阶段20年,从1956年到1976年。第二个阶段,从1976年到2006年,历经30年。2006年第三波浪潮开始,它会持续多长时间?不知道,可能25年,可能35年,也可能是40年。如果用人的一生来比喻,人工智能其实现在大概是刚上小学的程度,有的还不到小学的程度,所以现在它的历程可能只是1/10,后面有很长的路可走。
  人工智能到现在有三个主要的代表性的学派。第一个是用逻辑的方法做人工智能,通常我们把它叫做逻辑主义学派,或者叫做符号主义学派。第二个是以连接主义为基本工具,就是用神经元网络,今天的深度学习就是一个典型的代表。第三个学派,搞控制论的人,比较主张的一个学派,做自适应和进化、计算。这三个学派各有千秋,不能说哪个好哪个坏。
  什么叫人工智能?人工智能是人类智能的计算机实现,从对决的角度看,它永远不可能超过人类智能,只是在某一个特定的方面它可能胜出,但从智能本身看它没办法胜出。其实智能有很多方面,包括逻辑能力、语言能力、空间能力、感知能力,以及音乐感知的能力,肢体的控制能力。后面这几个是比较难的,包括人的内省、自我反省,人际关系的能力,自然探索的能力。自然探索的能力,包括图像、图形的感知能力。
  人工智能挑战人类智能?
  智能分为九个能力,而现在的人工智能只有三个能力做得还可以,有六个方面还相当的远,所以我们说现在的人工智能要想挑战人类智能,路还很长。1956年召开了人工智能领域里程碑式的会议——达特茅斯会议,讨论定出人工智能的最终目标。现在看起来,1956年定义的人工智能白皮书,一点都不过时。
  这次会议结束以后,全世界的很多学校都开始跨入人工智能热潮当中,典型的像斯坦福大学、CMU、MIT、哈佛大学很多人都做相关的研究,那个阶段大家采用的技术手段,主要是逻辑主义或者符号主义。
  什么叫逻辑或者符号呢?就是一切的推理,都可以用逻辑演算的方式来实现,只要定义了整个逻辑演算的体系,制定一个规则,就可以完成任何事,可以进行推理、数学证明,可以创作、奏乐等,所以全是通过符号的方式来做。这个事其实我们小学就学过代数运算,逻辑也是运算,但它不是用的代数运算,是用的布尔运算,其实和代数运算非常接近。有了这个运算就可以对它进行推理,推理你要使用一个工具,他们使用了演绎推理的工具。到现在为止,最主要的自然科学的定理,使用的都是演绎推理的方式来完成的。比如说亚里士多德的三段论体系就是非常典型的演绎推理,牛顿力学,麦克斯韦、爱因斯坦全都是用演绎定理推出来的。
  所有的基础逻辑的方法都是这样做的,当时设计了很多的人工智能语言,用这种语言可以写人工智能的方程,机器就可以证明。当然这听起来很好,而且是第一次浪潮,大家都认为十年之内,人工智能一定可以完成很多研究,但一直到1976年前后,大家发现一开始定的那么高调的目标,绝大多数都实现不了,加上当时有人落井下石。1973年有一个英国人写了一个报告,给AI泼了一大盆冷水,把AI研究分为三类系统,A是指自动机、B是机器人、C为中央神经系统。自动机和中央神经系统研究是有价值的,但进展太慢;机器人的研究毫无价值,而且非常令人失望。所以他建议把所有的机器人研究都取消;A和C因为它本身令人失望。所以也是非常低调的。
  这个报告出来以后各国政府全部都把对人工智能投入的经费砍掉,研究马上就进入了严冬。1976年是人工智能的第一次严冬。
  1976年开始有很多做神经元网络的企业,不停的写东西、发东西,一直到1986年,一个让人眼睛一亮的成果问世,叫BP算法(“误差反传网络”,也就是我们现在熟知的反向传播)。以往的神经元网络只能做非常小的事,做不了大事。但这项成果问世以后可以做很多大事,所以推动了这个领域飞速发展。但它也只能解决一些问题。一开始人们也期待要解决的很多问题,其实也是遥遥无期,到最后又遇到第二次的低谷,包括日本第五代机的失败,当时在斯坦福大学要建立一个知识百科全书的项目都失败了,使得第二次人工智能又跌入了低谷。
  第三次浪潮是从2006年开始的,人工智能的三个大牛人,一是多伦多大学Geoffrey Hinton,一位是蒙特利尔大学Yoshua Bingeo,一位是纽约大学Yann LeCun,他们这一年分别发表了三篇文章讲一件事,神经元网络可以进行大规模的学习,而且学习速度很快,精度很高。文章刊发以后,李凯和李飞飞设计了ImageNet,主要操刀的是李飞飞。ImageNet是全球图像识别比赛,在2012年以前都是用常规的方法做,从2012年开始有一个参赛队用了这个方法,和别的队相比,错误率降低了一半。
  到2013年其它方法全部退出,全都用深度学习。2015年错误率已经降得非常低。到2016年错误率已经低到不需要再改进了,所以李飞飞2017年宣布比赛停止,不再做了。
  五个关键技术
  由于深度学习,由于产业界的热情参与,人工智能领域产生了很多新的企业,有很多新的机遇,这是非常好的事。在这个机遇下,国家大力支持人工智能产业的发展,从国家战略角度进行了非常圆满的布局。中国新一代人工智能,主要有五个关键技术和一批应用。五个关键技术:第一是大数据智能,这和大数据关联性非常强。第二是群体智能,依靠群体的力量推进智能的研究。第三是跨媒体智能,要把声音、图像、文字、自然语言联结在一起研究智能,这是跨媒体智能未来所希望达到的目标。第四个是人机混合增强智能,通过人和机器混合,让智能更高,能力更强。第五是自主智能系统,其实就是无人机。整个人工智能学科的轮廓,包括计算机视觉、语言识别、自然语言、人机交互、机器人学习等方向,需要沉浸到应用层面。这涉及到人的九类智能,在逻辑、语言文字和图形图像方面现在已经做得相当不错,中间六类还有相当的距离需要探索。

参与评价

最新评价

相关推荐

最热观察

账号密码登录
第三方快速登录
找回密码