互联网+ 电子商务 智能家居 地理信息 智能制造 信息安全 3D打印 工业4.0 人工智能 光伏 新能源汽车 消费品 集成电路 移动支付 汽车 数据中心
全国首届中小微企业云服务大会
当前位置:首页 > 产业动态 > 战新 > 新一代信息技术 > 正文

北京大学电子政务研究院副院长杨明刚:大数据重新定义变革

发布时间: 2018-03-27 12:07     来源: 满天星

  2018年3月22日,“2018中国IT市场年会——工大数据与云计算高峰论坛”在北京香格里拉酒店隆重举行。北京大学电子政务研究院副院长、北京大学博雅数据研究中心主任杨明刚在大会上发表了主题演讲。
北京大学电子政务研究院副院长、北京大学博雅数据研究中心主任 杨明刚
  以下为演讲实录:
  各位朋友下午好,今天北京阳光明媚,春暖花开,也非常高兴我们来这一场大数据的盛会,非常有幸跟大家一起分享我们在过去的一段时间里面,在政府大数据以及我们上夜大数据里面的一些感想或者所想所得,我分享的主题是变革与创新,大数据重塑社会治理和公共服务。因为我们北京大学电子政务研究院基本上从事的是政府大数据相关的研究应用。在商业大数据我们也做了一些探索和尝试,今天分享更主要围绕政府大数据。
  下面主要分享两大块儿,第一块有关社会治理以及党中央国务院提出的国家治理能力,治理体系现代化,治理能力现代化,大数据在中间能扮演什么样的作用。第二部分,在未来商业变革中,大数据会起到什么样的作用。在讲到社会治理以及政府大数据相关内容之前,跟大家先分享几个事件,为什么会分享社会的热门事件呢?他给我们的社会智力,给政府大数据的应用其实特别有关系。去年11月18号北京大兴发生了一次大火,北京市出台了相关的政策,但是这些政策后来广受非议,包括网络舆论大面积的非议。我们在政策出台之前,要做真正的大数据决策,相关的支撑,不能拍脑袋。这个小女孩的形象可能大家记得很清楚,这个照片在互联网上广为流传,后面还有几幅图片全世界再灌注,这些图片在网上已经看不见了。在很多公共政策决策中,是我们有没有通过大数据的方法,对我们市政的措施提供科学依据,决策依据,包括驱赶低端人口,还有煤改气等等。这几个措施后来都是北京叫停,对整个政府的治理,对党和国家的形象带来了非常大的负面伤害。
  我们用大数据的方法梳理相关的节点,事件他社会的传播影响力非常有价值,经验或者教训在这些事件中我们可以看的非常清楚。包括在国内外,在海外也引起了大量媒体的热议。很多人会质疑社会治理一刀切,通过大数据的方法,如果我们在座是市委书记,市长,通过这张图,我们公共治理政策决策出来的时候,公交卡的数据,出行的数据,大致可以判断出来哪些人在多少公里之间移动,我们通过相关的特征分析,基本上可以锁定哪些人在城市,主城区跟郊区之间的往来,基本上可以判断出来他住的哪些区域,我们发现所有的低端人口,或者是外来人口,主要集中在北部,昌平区,朝阳区,丰台区。大家可以看大兴的分布并不是很显著,这是公交卡的数据,是呈现正相关的。我们对出行数据分析以后,我们在天津大张旗鼓的搞这样的事情,在大兴可能方向本身就是有问题的,通过大数据方法,如果政策出台之前听取大数据相关分析,可能我们政策就不会有很多的盲目性,当然也不会有后来那么多负面的东西。通过这个事件,我们基本上可以总结出来,用大数据来决策,可能比拍脑袋决策来的更靠谱,更准确。
  这些事件都是这样的,通过公共事件的分析,公共事件网络的数据也可以把他归为政府大数据,或者政务大数据的一部分,其实也很牵强,大家知道在今天政府作为一个数据的重要生产方,他占据了目前份额里面60%以上的社会数据,随着我们整个智慧城市,以及我们现代城市发展,以及现代商业发展,很多数据由社会产生的,这块儿的数据量越来越多。而且随着智慧城市以及电子政务的发展,我们城市管理中也产生了大量的实时数据,这些数据包括我们的水务数据,交通数据,人口移动数据,电力等等,围绕城市相关的所有数据,有了这些数据之后我们才能做更多的大数据分析。今天互联网公开这些数据,每个企业都可以拿到,每个企业在上面做了很多工作。过去一段时间,摄象头的数据,在我们北京市的摄象头基本上遍布大街小巷,对我们从事社会治理,或者说城市管理的人来说是非常好的东西。这种数据跟个人的隐私也相关,比如电子商务平台购物数据,社交媒体上沟通数据,表达数据。通过这些数据我们可以锁定这个人现实活动的轨迹,网络上的态度倾向,或者对某类事件的态度。基本上能够对我们每一个人进行很精准的数据画像。
  说到大数据不是大水漫灌的概念,他有了大数据以后,让我们可以更精准的关切到每一个人的关切,也就是说,有了大数据,其实我们不是讲这一群人怎么样,我们要锁定每一个人个体需求,通过大数据。我们能捕捉到这个城市中,或者我们社会中需要给予关切的人,比如精准扶贫,城乡一体化建设,其实需要我们每一个个体通过大数据给予更多的关注,这才是大数据,大数据不是一个笼统的概念。有了这种数据的精准画像,通过大数据的方法,让我们把真正需要给予关注的信息给予关注。比如说我们在研究社会治理中,那些极端的事件,那些个案数据,其实就是我们需要关切的数据。换一个场景来说,比如说在社会综合治理中,我们涉恐涉暴的信息,一定是跟这些大的数据不同的,他带有异常的数据特征,包括电信诈骗。尤其去年有那么多的学生马上入学了,遭遇诈骗,后来想不通心脏病复发出现人命,从某种意义上说银行或者电信部门,对异常的数据流动我们可以监测的,或者说异常数据在合规的样本中间之占10%。我们通过一种方法完全可以发现这些数据,这些数据就是电信诈骗的数据,或者说涉恐涉暴的数据,或者说异常的业务流动数据,我们完全可以发现,或者通过一种方法预警,及早的发现。
  说到大数据,有很多概念性的东西我就不说了,在整个大数据中间还有一个结论性的东西,美国有一个叫巴拉巴西的一个人,翻译过来叫爆发。他提到人类行为的93%是可以预测的,换句话说我们今天在互联网的活动,包括我们今天来开会,完全可以画像。也就是说有了这种画像,可以对未来一个月我们的消费行为,社交行为,或者说我们的出行行为都能够做出基本上方向上的判断。其实这就是大数据,在今天每个人,在网络的时代,在数据时代我们都是透明的,再换句话说其实没有什么隐私,我们的银行消费数据,网上表达数据,换个马甲一样可以发现,我们在微信上的讨论,沟通,其实都是有迹可寻的,那些犯罪分子,包括暴恐分子他们会隐藏这些数据,不用手机,也不用传统互联网手段,面对面沟通,他想方设法的掩盖这种数字的痕迹,或者数字的踪迹。对绝大部分人来说这些数据其实我们是心理很坦荡,也无所谓,这里会引出更严重的问题,数据隐私权边界问题,我们登陆一个网站的时候,我们已经默认了数据全部交给他了,登陆淘宝,京东的时候会默认家庭住址,购物偏好,都交给他了。所以在今天大数据的时代,说到隐私权的话题延展起来比较宽泛。
  在过去很长时间,我讲过很多课,有一次我去东北某一个公安厅,跟负责技术的一个领导在沟通,都是好朋友了,在内部的会议上就问到我一个问题,他说杨老师,有很多人跟我讲大数据,其实我到今天我都搞不懂什么是大数据。第二个问题,这个大数据对我有什么用,大家知道在很多行业,比如说金融、电信、政府部门已经觉得过去20年里面,建了很多信息化的系统,尽管这些系统之间是互相屏蔽的,或者数据是隔离的,目前没有融合,这也是我们大数据企业要做的事情,目前刑侦系统,交管系统,反恐系统,社会治安管理系统等等,垂直的系统,在部门内部有很多垂直系统,我用的非常好,提高多少破案率,提高多少案件的结案率,非常好。为什么要用大数据?其实这个话也问给我们在座每一个做大数据的这些企业界,或者学界的人,为什么客户要去做大数据系统?去做数据融合系统?去做数据整个可视化展现系统。这里面有一个问题,用一句话点破企业政府的顾虑,在过去比如说缉毒的部门跟凶杀案部门,跟交通管理部门,数据是没有在一起的,但今天这些数据如果放在一起,可以很精准的还原一个人立体的画像,这个时候我们很容易发现犯罪线索之间某种潜在的关联关系,比如银行卡关系跟犯罪分子出境数据,住店数据,网络上的消费数据,是有某种关联关系的。也就是说我们常规大数据分析,当然是像天气预报一样,分析股票趋势一样,我们可以分析的非常好。因为数据之间是强关联关系,但是在某些场景下面,比如说涉恐涉暴,公共治安管理,犯罪分子想方设法的降低关联关系,这个时候我们就需要用一种独特的分析方法,区别于传统的,像股票分析那样的他是有规律的,强关联关系,弱关联关系,我们要发现异常点之间潜在的关联,或者发现新的知识。
  第一张图我在很多场合也讲过,跟大家分享过,在草中间发现一根针,每个草的物理属性我们是知道的,每根针物理属性我们也是知道的,就像中国古代没有计算机的时候,用数据统计的方法发现某个特征。比如找寻中共党员民族是汉族的,或者博士毕业的,本科毕业的,检索出来而已,这张图其实是传统的数据分析,他只是大数据分析中很简单的一部分,基础的部分,真正大数据,在目前社交网络,或者现代社会治理,潜在的数据关联才是我们大数据分析的本质。比如说金融诈骗,反洗钱的线索,或者谁可能是犯罪分子,哪一笔交易可能存在问题,这个时候我们要通过传统方法是看不见的,要借助某些必要的工具去发现,就像这样的立体图我们很多人都看过,看半分钟才能看见里面有字或者里面有小动物,真正大数据分析,或者未来的大数据分析其实是这样的东西,在一堆看似没有关联的数据中,发现某些潜在的数据逻辑。
  这是可视化的分析方法,这里面有很重要的一个体系,我见过很多大数据的企业,做大数据分析,包括做底层融合,数据整个结构化处理,其实用的都是基于二维表这样的关系数据库,但是某一类场景中,比如说电信诈骗,商业欺诈案件,我们需要用一种图数据库方法,去发现数据之间某些关联关系。这些图数据库不知道在座有没有企业做,很少见到有企业专门研究图数据库数据分析,但是这方面是很大的市场,很大的场景需求,用图数据库分析异常的数据,或者说某些数据之间的关联关系。
  这是图数据库在某些领域的应用,包括在公共安全或者是社会网络,以及金融行业的应约。很容易发现某一类事件特殊的数据表现,这是分析一些公共事件,也是很有名的一次暴恐事件的分析。
  在过去几年,我经常碰到做政府信息化的企业,过去两三年他们的名片已经换了,从系统集成公司,系统公司摇身一变,变成了大数据公司。大数据在这些行业都存在,都有做大数据公司,但是这些基本都脱胎于过去的信息化基础工程,很多时候大数据不应该成为大忽悠。大数据我们在座很多都是业界的,跳过了。在政府领域里面,其实大数据才刚刚开始,刚才我讲的场景,我在公安厅给他们讲课,问到过大数据有什么用,在犯罪的关联关系中,数据源掌握的越充足,数据样本占有越多,预测分析,某种关联关系才能发现的更精准。很简单的一个道理,目前整个政府的大数据这块儿,在过去两年中,不同的部门,包括工信部出台了二三十个文件,不包括地方大数据规范。但这里面其实像中国的电子政务一样,过去是九龙治水,在今天大数据应用中,依然可能会面临这样的问题。在智慧城市或者是数字城市中我们会发现很多省市都是摸着石头过河,而且基本上信息系统都是有赖于一把手首长,他要懂就可能推进很快,他要不懂就很慢。我们今天还是存在这样的问题,每个省之间是不通的,甚至在每一个省里面每个地区之间,每个市之间也是不通的。这就是我们整个智慧城市,电子政务的现状,在这个基础上,我们的大数据应该怎么做。
  我们在过去的几年里面,也跟相关的部门做大数据云政务的顶层设计,但是带有强制性,规范性的标准没有出来,从技术层面。所以今天我们每个城市都在搞大数据,基本上都是围绕产业园区做产业,没有人,或者没有太多人去关注数据底层应该怎么构建,或者未来共享架构应该怎么布局,还没有。所以我很担心我们的大数据每个企业,政府这边有选择性的去做,最后发现大数据有很多云,这些云之间还是不能相通,其实这才是我们这个行业未来面临的很大问题,我们所有人都会面临,你今天做了一个行业,但是你要做其他省这个行业,障碍非常大,就是因为数据底层不相通,包括政府部门也是这样。
  大数据一定是一个趋势了,党中央国务院习总书记去年12月8号在中央政治局第二次学习会议上也特别提到数字中国,他把大数据提到了非常高的高度,无论大数据在社会治理,政府发展,公共服务,或者说未来整个的一带一路布局中,大数据一定会起到非常重要的作用。所以今天我们已经迎来了一个非常大的大数据领域机遇,在座的业界我们遇到了非常大的机遇,或者说大数据的风口。但是大数据在今天跟三年之前,更回归于传统实用的本质,如果说三年之前大数据是为了忽悠政府,希望政府来投入,政府上项目,在今天大数据已经落在地上了,真正脚踏实地用大数据,为我们政府管理,为我们企业真正提供一些东西。不能再靠概念了,就像云计算一样,云计算在头五六年也是吹的天花乱坠,但是今天剩下的就那几个了。
  大数据目前应用困境也是跟电子政务一样的,从根子上是一模一样的,因为大数据说实在话,他也是属于政府信息化的一类应用而已,他只是跟场景。他脱离不了中国电子政务大环境,或者说某些体制性的环境,更主要是标准,另外是应用场景。这个标准如果定不下来,应用场景再复杂多样,哪个公司都在做,哪个业界的人都在里面研究,但是我们永远形不成一种声音,形不成一种趋势的力量。所以我们也希望业界,相关学界,以及政府部门联合推动大数据相关的标准设计。这个非常重要,我们经常会发现,闷着头走,走错了。经常要低着头,还要抬头看路。
  大数据在未来的智慧城市中,所扮演的角色会越来越重要。无论从我们的政府治理,以及我们对城市的有效管理,或者是城市的治理,大数据一定会起越来越重要的作用,比如说智慧交通,智慧水务,电力,相关能源布局等等,包括雾霾,北京今年的雾霾相对比较少,关停了很多周边的工厂。但是一个大城市,或者中国的城市,在过去几年我去了很多的城市,发现很多城市开始有雾霾,而且都出现了堵车,其实当然一方面是因为我们基础建设没有跟上,另一方面也是因为城市发展扩张,比过去要加快了很多。所以所有的城市都面临一个问题,通过大数据方法,通过信息化方法提升城市的运转效率。基本上我跟大家分享的也就是这么多了,说来说去大数据还是要回到一句话,让大数据真正的为老百姓服务,为人民服务。用十九大报告中的一句话,不忘初心,方得始终,谢谢。

收藏