互联网+ 电子商务 智能家居 地理信息 高端装备 信息安全 3D打印 工业4.0 人工智能 光伏 新能源汽车 消费品 集成电路 移动支付 汽车 数据中心
2018中国半导体市场年会
当前位置:首页 > 产业动态 > 战新 > 新一代信息技术 > 正文

百分点集团研发总监黄伟:动态知识图谱,让机器拥有上帝视角

发布时间: 2018-03-27 12:52     来源: 满天星

  2018年3月22日,“2018中国IT市场年会——工大数据与云计算高峰论坛”在北京香格里拉酒店隆重举行。百分点集团研发总监黄伟在大会上发表了主题演讲。
百分点集团研发总监 黄伟
  以下为演讲实录:
  大家下午好,因非常高兴今天有机会跟大家分享一下百分点在大数据行业的理念,产品和技术,以及具体的应用案例。百分点是在大数据行业给企业和政府,赋予他们数据基因,提供解决方案的基因,我们做整套解决方案和提供技术产品的过程,整体可以分为三个步骤,简单看为三个D,我们把现实世界中各个企业政府,基于现实世界的数据数据化,第二个D,基于数据化之后的事件,我们进行分析和洞见,通过分析和洞见得到的决策应用到现实实践,重新去设计整个现实世界的业务流程。如果说人是靠大脑来理解现实世界的话,其实我们期待在大数据的领域,机器能像人一样,或者接近人一样去理解,在他的数据世界里面像人一样理解他的世界。虽然现在在感知,比如说图象,或者是声音,因为深度学习的发展,基本上碾压所有的学术界,我们机器和人差距的很远。百分点一直持续做探索和实践,我们最新的技术的进展,动态知识图谱。
  认知的核心是什么?我们需要聚合所有数据,将这些信息聚合出知识图谱,让机器在认知层面上做的更好。提到认知,什么是认知?认知实际上是我们说,我们人类的智能化的水平,如果把人类智能化水平分成三个层面的话,第一是感知,感知类似于我们的的皮肤,我们的嗅觉,我们的听觉和我们的视觉,我们可以把物理的信号转化为输入到大脑的信号。第二是认知,我们可以把这些分段的信号,把他融合在一起,形成认知。认知到底和感知有什么样的不同呢?最大的核心在我们认为是连接和互通。举个例子,中国有句话叫一朝被蛇咬,十年怕井绳。把这两个感觉合并在一起,你能生发出认知,蛇恐怖,是危险的,才能辅助到决策,我们有认知,有决策,决策就是远离他。
  百分点的动态知识图谱技术,是什么一个概念呢?我们用这个技术,实际上是从海量分散的数据,会聚出知识图谱的技术,这个知识图谱是什么呢?我们可以这么看,可以分为实力和概念,实力就是现实世界中一个一个的个体,比如说一个人,人是一个概念,概念是实体的抽象,实体之间他们可以形成各种连接,因为为了做这个事,是用数据来描述真实的现实世界,所以在哲学里面,如果你的概念是描述现实世界的话,哲学上有一个本体。更通俗一点理解,一个是实力,一个是正常的现实世界,另外一个世界观,因为我看了很多的实力,抽象出来的概念,这个概念叫做世界观。动态知识图谱是什么样一个技术呢,动态知识图谱是我们去融合各样的数据,通过融合数据做本题映射,产生知识图谱的技术。这里强调两个字,动态,动态什么意思呢?两层意思,第一层世界是在变化的,知识图谱不是一成不变,数据反映现实世界,现实世界一直在变,我们需要用动态这样的技术,来实现我们照出来的知识图谱是动态的,第二层动态的意思是我们的世界观在变化,在现实的业务中,不可能一下能拿到所有的数据,一定程度上肯定是持续会有新的数据进来,新的数据会对你的世界观冲击,你的模型概念会进行变更,我们需要动态知识图谱这样的技术,让我们的概念弹性可扩展,以防止在我们所有系统上线之后,我们还需要改变数据模型的时候,重新录入数据。
  基于这样的技术,构建出来的知识图谱,我们在这一层上面,我们看到的已经不是一个一个点的,我们实际上融合的是全部知识,在知识之上,我们去构建做搜索,去做统计分析,多维度的分析,地理位置的分析,包括知识图谱的推理,机器学习,能让我们的业务系推更加智能,百分点基于这些小的功能,他们融入到五大行业,营销、媒体、制造、公安和政府。使得这几个很也的应用具有更好认知的智能。我们在去年12月底的时候,把这样的技术产品做了一个发布会,下午比较困,这里大家可以看一个一分多一点的产品品牌视频。(视频)
  这个是我们去年12月底发布的中国首个行业AI的决策系统,这个系统可以分为三层,最底层是基于大数据操作系统底层,有了大数据底层平台,我们能够支撑海量数据存储,计算,管理,交换等等一系列的应用场景,在数据层和平台层之上,我们构建以动态知识图谱为核心的认知引擎,包括自然语言理解,自然语言处理,智能标签等一系列更多偏认知层面,中间层的组建,在智能引擎之上构建了五个行业的场景系统。他们是智能营销系统,全媒体服务系统,制造和物联网大数据系统,智能政府决策系统。这里会重点讲两个,一个是政府智能决策系统,还有公共安全领域的安全分析系统。
  智能安全决策,我们有一个案例,是在国家质监总局,我们大概处理一千多起的汽车召回案例,五千多万的汽车召回,每个季度会邀请15名专家,专家做评审来决定,到底是我们这一期要召回什么样的车辆,或者做什么样的召回,在会议之前,我们总体算了一下需要大概200个小时人工抽取,分析。有了这个系统,上了我们的智能决策系统之后,我们怎么做的呢?是把质监总局收到的反馈投诉数据,以及互联网上,比如说汽车之家,各种汽车行业他们评价数据,抽出里面基于汽车行业各个模块的知识图谱,加上之前他们做召回决策使用的一些历史数据,让机器自动来做决策,结果就是我们随时可以做一次这样的召回决策,只需要1%的时间,人员只需要机器和一个人的审核就可以完成。所以大大的提高了决策的效率。
  第二个应用场景,是我们把整个的政府决策,除了在国内,我们现在进军到海外,主要给非洲,拉美提供政府的智能决策,以及公共安全的解决方案和应用技术产品。里面就有一个比较有意思的,非洲一个国家,他们国家其实是修宪,改变总统年龄。这时候在脸书,推特他们的民众很多很多的评论,这时候要做的事情,我们搜集所有的数据,包括谷歌等咨询网站的数据,形成人员和组织的关系网络,并且分析每个组织,每个人员他们发布的帖子内容,进行分析,我们就可以很快的给到政府,给到客户说,比如说现在网络舆情到底什么样子,反对的声音是哪个渠道声音最大,到底反对的原因有一些什么典型的意见,以及反对的趋势是什么,这种是突发一个事件,政府需要马上得到决策信息的支持。还有一类是大家都知道,在好几年前,北非是因为脸书里面传播一些反政府的言论,爆发了革命。那些政府实际上不像中国对舆论管控非常好,他们非常非常这块儿技术,检测脸书或者推特社交媒体上面的信息,几十做预警,以防事态发展不可控制。
  第三类应用场景,我们也是给海外,以及包括国内的一些政府公安领域提供的产品,这个产品主体是我们用动态知识图谱技术把所有信息会聚在一起,我们把信息会聚成以人为核心,组织为核心,物品,位置,事件为核心,我们可以做很多很多挖掘,包括强的关系和弱的关系,特别是在这样弱关系最重要的,比如说两个人之前同时出现,因为他们犯罪,他们被抓到同一个监狱里面,就是狱友的观念,他们同时在一个地点,比如说监狱,同一个时间段,我们可以找到他们隐藏的相互关系,如果再有更多的数据,比如说有电信通话数据,发现他们还有很多电话通话,出行的数据,关联到这两个人有时候一同出行,说明这两个人关系是很强的,这种关系实际上要比我们强的关系,比如说谁是谁的父亲,谁是谁的母亲这种强的关系更重要。所以我们可以做很多事情,比如说事件的关联,比如说我们可以看人群的聚集,做一些人群聚集发现,做一些重大事件的预警,应用到国民安全,都有很多应用。我们也有一个产品视频,大家可以看一下。(视频)
  以上是我的分享,百分点利用动态知识图谱的技术,从信息会聚出知识,在知识之上,构建了这样一个品牌产品,谢谢大家。

收藏