Informatica首席顾问:如何实现大数据、主数据双赢

原创
云计算
但彬提出,现在媒体在大数据时代不仅仅是传统的数据交易和简单的分析数据,各种各样的信息源都可能成为信息输入口。但是如何确保数据的准确性和唯一性?现场用一个虚拟用户在Informatica客户管理系统中演示了如何识别一个客户。

8月16日,2012 Informatica全球巡展研讨会在北京举行。此次大会以“智汇数据,集聚价值”为主题,旨在借助主数据管理,帮助企业远离高成本和高风险。

Informatica大中国区首席产品顾问但彬与在场观众分享了“如何借助大数据来提升客户的价值,实现大数据、主数据双赢”。

但彬提出,现在媒体在大数据时代不仅仅是传统的数据交易和简单的分析数据,各种各样的信息源都可能成为信息输入口。但是如何确保数据的准确性和唯一性?现场用一个虚拟用户在Informatica客户管理系统中演示了如何识别一个客户。

主数据横向核心能力侧重在哪几个方面?一是核心主数据要解决多域问题,二是针对各个行业的解决方案,三是不断地跟云和大数据领域的整合。

详细报道请看:2012 Informatica 现场直播 全球巡展 北京站现场直播

以下是文字速记:

但彬:
    各位下午好!
    今天要给大家分享的是,如果借助大数据来提升客户的价值,叫大数据也好,主数据也好,我们都是希望通过更高的质量来提高客户的价值,来使客户从中获益,也使我们自己的业务从中得到发展。
    前面托尼·杨跟我们分享了一个故事,说一家银行收购另一家银行,这两家银行合并给我们带来一些什么样的苦恼呢?我们看这样的情况,现在媒体在大数据时代已经不仅仅是传统的交易数据和简单的分析性数据,我们看到各种各样的信息源都可能成为我们信息的输入口,包括INFABANK有网上银行,也有微博,他可以通过微博表达一个什么信息呢?他说了一句话表达了两种信息,一是我的私人信息被卖用。当他给我们客服人员打电话,客服人员告诉他你的信用卡还有多少,他觉得很诧异。同时他向我们客服人员进行投诉的时候,客服人员并不知道他投诉的谁,客服人员在三十分钟得到各种切换,使他得不到满意的答复,他很抓狂。实际上我们经常出现这种情况,可能还不是在银行合并或者企业重组的状态下,其实在现有的生产环境中,包括业务系统之间的相互独立,已经足以造成客户或者业务层面的问题。
    开始提到他讲的故事是这样合并的情况。那解决客户生气的时候怎么解决呢?我们要找到相关的公司,由INFABANK给我们提供解决方案,第一步要进行查找到相关的信息,之间的关联关系,找到我们的信息在哪里,同时发现其中哪些信息受到保护,同时识别出开始看到这个抓狂的先生,我们管他叫王嘉明,到底是哪一个王嘉明,可能在银行里有很多王嘉明。第三个把所有真正的王嘉明信息进行相关的重组,获得全方位的360度的视图。另一方面,我们需要把他证件的信息、信用卡的信息进行相关的保护。
    现在来看看发现,如何才能发现一个企业信息。开始提到INFABANK和银行进行合并,合并以后带来的问题是什么呢?他们的业务只是放到了一起,但是所谓的合并和整合是两个概念。我们可以把两个东西搬在一起,但怎么使他们的业务有机运行在一起,这不是一天两天能解决的,如何缩短这样合并的进程,使得客户混淆或者不满降到最低,如果我们合并变成最低风险,就不是1+1,而是1+1再减0.5的结果。这样我们知道两家银行的信息可以找到互相关联的关系,同时一家银行为主,一家银行为辅,开始在第一场演示时看到,拿过来的信息全部是没有关联的,就跟现在这样,这是关联以后,关联以前并没有任何联系,并不知道这个客户和这个客户两张表有没有来源,有没有关系。这个表里的客户和客户信息能不能关联,关联度有多少。我们其中发现这个功能,可以自动识别出之间隐含的关联关系,这样可以保证信息的参照完整性。
    第二方面,我们要识别,开始谈到了王嘉明,当然也开始提到像王嘉明这样的名字,在银行中可能找出五十个甚至一百个。但是我们可以认为这五十个是一个人吗?为了不出错,我们一般情况下会分成五十个人,因为我们不用对一个客户负责,但是银行第一要务保证对账户的准确,知道这个账户是某一个人是不完善的,我们需要这个人到底拥有哪些产品,甚至他除了我们银行内的产品以外,还有哪些通讯工具是可以用的,他有哪些方式可以对我们进行交互,他微博账户是什么,要不然在我们银行微博里发表评论的时候,我们都不知道这个人突然冒出来,但是也并不知道到底有多少人关注这个人,这个人的影响力有多少,所以要了解一个人,他的信息相当全面才能定位一个人。同时定位这个人和其他叫王嘉明的人是一个人还是不是一个人,是一个人一定要合在一起,不是一个人一定要切开,才能全方位了解他,这就是识别的过程。
    我们来看识别简单的过程,我们这里有一个演示,他讲了一个故事,比如这时候看到整个画面里面,在右边是偷听的王嘉明,他很生气,这也是他抱怨给银行看到他在抱怨业务。同时在生活中又是另外一个人,这个人站在走廊的尽头,他在干什么?这个人是不是他呢?也会发现在生活中有一段视频,他从一个车前跑过来,我们有两种认为,一种认为当车开了他在躲车。生活中我们认识一个人也是从侧面认识的。我们从另外一个角度去看他在干什么呢?他高过去,冲着一个戴礼貌的人,把他的包夺了过来。这个时候我们觉得王嘉明是他吗?可能不是他,他是个文质彬彬的人,他不太像一个劫匪,不可能夺别人的包。这个时候我们了解王嘉明吗?你会发现各个方面的信息不能串在一起的时候,你快神经分裂了。经过全方位的看,我们认识一个真实的王嘉明,上面有一个扳手掉下来,他跑过去救了他。其实我们的微博也是这样一个状况,所有人都在发表意见,每个人从自己的角度发表意见,他认识这样一个事件是否完整,我们认识王嘉明也是这样,我们可能克服系统知道他是愿意抱怨的人,但是网上银行认为他是购物达人,但是微博里认为他是发言狂人,只有把这些信息组合在一起,他才是完整的王嘉明。
    我们看了这段故事,帮助我们了解认识一个人应该是多方面的,通过各种信息的发现、识别和关联,全方位认识一个人。我给大家演示一下,我作为INFABANK的一个雇员,我如何通过一个Informatica客户管理系统帮助我们识别一个客户。
    这是我们看到的Informatica客户信息登录界面,我以一个客户专员的角度,要了解一个客户的消息,当他有投诉的时候,我应该怎么做呢?我是以一个身份登录,我这个身份设置的比较特别,他更加关注客户在网络媒体的评论。我刚进来的时候,会看到收到一条信息,这个信息说王嘉明先生通过微博表达对客服的不满,他的这个不满做了一个流程,因为收到信息以后,当我们的系统整合来自微博的信息以后,自动推送到我这个岗位上,我要处理这些不满,或者认为这些不满是真实还是不是真实,要跟客户解释,可以处理它,可以不处理它。但我如果要处理,我要处理客服不满这件事,我看到这个人叫王嘉明,我去查一下我的系统里这个王嘉明叫什么呢?因为大家看到他第一眼的时候他叫王嘉明,有的时候客服只是接了一个电话说我叫王嘉明,他就记住这条信息。我可以对他进行客服信息查询,现在我打一个查询,王嘉明,然后进行查询。在系统中看到确实存在这样一个客户叫王嘉明,我们打开详细信息,我们看到王嘉明生于1980年7月1日,虽然是80后,但是现在已经进入30岁了。我们可以看到他的证件信息,在对于一个客服来说是不应该的,对于后台系统来说可能看的见,这是我们下一步要改造的。
    我们看这些客户有什么样的特征,他的信息注册在成都,这个人并没有采用我过多的产品,他只是用了一个储蓄账户的一张信用卡,他整个客户评级,我们内部有评级,得数不高,3分,同时看到他给我发的一个抱怨,查出这个东西并没有这个账户信息。同时反过来,他倒是有一个FaceBook,从这个来看这个人并不是十分受关注的人,他的关注度只有277,并不是像粉丝很海量的,像有的明星可能就几十万。再看看他的家庭关系会是什么样子,另外开始提到了,我解决问题的时候,最后是把我妻子的电话解决了。但是从这个信息来,王嘉明的家庭信息中并没有他妻子的信息,只有他账户信息和相关FaceBook的状态,我们认为这个可能不是,有可能是录入员录错了。#p# 
    我们做一次蘑菇查询,看一下跟王嘉明相似的人到底有多少。我们看到在这个系统里面,凑巧有两个,一个叫王嘉明,一个叫汪嘉明。从字来看只有一个字相似,他们的生日一个是7月8,一个是8月7,我们先看一下这个人的信息是什么样子,从上面来看,有大量的负债,三千可能是随便一个数,可能是三千万,他有很高的资产,相对来说他的信息很全面。他有负债的原因是什么?他有一个质押贷款的服务,同时他确实有一个信用卡账户。这个人在微博状态是什么样的?也发现他是很爱发言的人,我们用五百表示他的发言数是比较高的,可能在一段时间内发了五百条。他的被关注数也是很高,有上千人关注他的行为,他关注的人相对较低。这个人可能在舆论上可以带来很大的影响。同时我们也评估了他投诉事态的严重性。从他自己的信息来,我们发现这个王嘉明是不是开始那个人呢?我们是不是要去查一下跟他相似的人是不是可以进行对比一下,我们可以去察看这样的重复数据。这时候会看到这里面有两个人,我们显示一下这两个人哪些信息是相似的。从基本信息来看,系统认为他们的名字,出生日期和证件号码比较相似,所以相似度比较高,97分。在银行确认里面,认为他基本可以判定为一个人,可能有些是笔录的错误。
    同时去看一下他的信息,会发现每个其他的信息都是来自于银行的主观信息,而客观信息是比较相似的,可以对他进行合并。合并的时候,我们系统会跟你推荐说把两个人合成一个人,一个人叫王嘉明,一个叫汪嘉明,系统会根据不同权重和可信度,同时加上日期来进行评价。比如出生日期,他们会看到他更倾向于8月7日的日期,他如何得出8月7日更好呢?其实有一个评分值,后台会计算这个生日可信度更高一些。当然你可以不选用这个值,甚至可以说7月8日、8月7日都是错的,因为这时候当我找到这个客户以后,我欣喜若狂,我会给王嘉明去一个电话,说王先生你好,刚开始你抱怨的问题,因为系统的原因和一些原因,我们有些信息认为有冲突,我们希望你有一个确认,未来可以更好的提供服务,我想你可能会得到一个真正的信息在这个地方。我们先不进行调整,我们可以去进行合并。合并以后,看到这个信息从地址信息都合在一起了。可以看到王嘉明有一个储蓄账户,汪嘉明有一个贷款账户。其实我们可以从另外一种方式看到他更完善的信息。我们可以看到把两个王嘉明和汪嘉明都合在一起了,他们联系方式和产品都合在一起了,同时在王嘉明家庭信息上面开始漏了一个信息,发现有一个王爱丽,可能是他的妻子。同时我们发现一个意外,他的妻子是一个企业的老板,他自己有一间公司,她这间公司同时是INFABANK的客户,这家公司也有我们这个银行的产品。从这方面可以锁定王嘉明确实是我们的客户,有很大的业务往来。同时我们可以把两个家庭进行合并,合并的过程是相似的,简单的合并就行了。合并以后,这个家庭叫什么名字,新的家庭住址愿意用哪个都可以填上去。合并以后的信息是什么样的,这样的信息已经确认了,放大一点可以看到两条信息的关系还存在,可以把这个关系删除掉。
    开始我做这些动作,就是客户经理日常要维护一个重要客户的过程。可能他的维护过程并不是一定要到业务系统里提请交易,可能在IPAD上就可以做相关的事情。如果继续深挖这样的信息,会发现还有更有价值的信息出来。比如开始看到的王爱丽,既有一间公司,同时有一个信托账户。信托账户上面有两个姓王的人,一个叫王爱华,一个叫王大伟,这个人跟她有共用账户,其实我们跟王先生确认的时候,他说这两个人是我们的孩子,一个儿子,一个女儿,他们跟妈妈的关系比较好。我们可以把王大伟放到这个家庭里面来,他会问你,这两个人是什么关系,是家庭的成员关系,我们可以把它建立起来。
    开始我们提到了王嘉明和他的爱人,他们两者是夫妻关系,我们也可以把他们之间建立一个关系。这个时候会发现关系有很多种,可以选择夫妻关系。这时候我们会发现整个一张完善的客户信息的视图就帮我们构建起来了,我们认识这个王嘉明的时候,不再是只有储蓄账户的普通人,不会说简单地有抱怨,你会发现他的抱怨来自实力雄厚的客户,他会有很大的脾气。
    这个演示只是简单地演示到这里。像日常处理中,会在演示完成以后,就可以把这个信息看完以后,可以处理开始看到的那次投诉,会说这个投诉问题已经解决,我们已经把相关的信息收集全,并且得到客户的一个认同,这是我们常见的客户处理的过程。大家可以看到客户信息一致的问题、不一致的问题经常会困扰我们的客户,特别是面向虚拟的客户就是这样的,因为服务就是我们的一个重点。
    在开始谈到整个平台,我们都是在Informatica主数据平台的基础上,刚开始谈主数据就是一个很空的壳子,它完全可以落实成一个一个应用,我们在主数据基础上发展面向27个行业不同的解决方案,100家客户都在采用我们的解决方案,有的解决客户的信息一致性的问题,有些是帮助解决生产过程中的产品资料重复的问题,像国内的客户,这两类问题都会遇到。有的会混淆我是不是重复购买,当我需要用替代品的时候,我不知道仓库里哪个产品可以用,如果有人故意扭曲把变压器写成另外的东西,或者写成英文,看的还是变压器,但是两者去找的时候是找不到的。这些信息都会带来一些问题。同时在生产过程中有人会故意混淆去做,因为提取的速度很慢,如何屏蔽或者杜绝这些现象,帮助我们业务运行更加流畅,都是需要一些解决方案。在我们的客户50%以上都是全球五百强的客户,同时我们的解决方案也在购置在不同的解决方案里应用。在解决功能的时候,Informatica十分注重产品的性能,我们觉得要做大量的定制和开发的过程,就可以快速让人体会到数据管理和客户信息一致性带来的好处。
    Informatica主数据解决方案主要从两个方向发展,一是解决主数据的核心能力。另一方面解决平台上面的整合能力。这两者能力,对于我们来说可以帮助客户达成怎样业务的一些优势呢?一方面解决不同领域的专业主数据的问题。在主数据里,大家会谈到关于主题的概念,比如刚开始谈到客户,就是一类主数据,一类主题,谈到产品也是一个主题,谈到组织机构也是一个常见的主题。同时在行业里面也有较大的差异性,比如说面向服务的,可能就会发现以客户为主要目标,面向生产就以生产保障为主要目标。同时在Informatica解决方案当中,除了主数据之外,外围有很多产品帮助他获得和收集信息,可以以各种形式获得各种来源的信息,来转换、发现等等处理信息。
    同时从线下来看,会很快适应你的业务,这就是我们谈到的两个方面,托尼·杨谈到的,一方面提升价格,另一方面压缩成本。两者的差、两者的除才是真正企业数据的价值,如果提高企业数据的价值,通过一个提升、一个下压来实现的。
    在主数据平台上开始谈到核心方面,一方面就是平台方面。平台方面有哪些支撑?一方面看到数据质量方面,开始谈到可能一个叫王嘉明,一个叫汪嘉明,在我们看来,这是两个完全不一样的。但是在日常输入中,不管客服还是柜台都会变成一种常见的错误,那么如何识别这种错误,以至于解决客户之间一致性的问题,这就是常见的问题。其实在数据领域还包括大量的问题。举一个例子,同时数据集成可以帮助我们快速的,比如不同的银行,不同的部门,把数据收到主数据当中,B2B的数据整合,比如来自微博的信息,完全不同于日常的信息,完全跟主数据集成。可能来自其他行业,比如医疗保险行业,可能来自于医院的一些信息,这些都可以利用B2B的交换平台,实现数据之间对接和交换。同时我们紧密地跟云运用集成,比如跟FaceBook,同时我们的主数据平台也可以实现在云应用之间互相集成、互相调用。
    开始谈到的主数据横向核心能力侧重在哪几个方面,一是核心主数据首先要解决Informatica所谓的多域问题,如何去适应不同行业、不同主题领域解决方案,比如说可以去做一百个或者一千个,但是总是会有第一千零一个出现,所以平台本身的适应性很重要。所以主数据平台最重要的特征是有多域的支撑点,我们管它叫多主题的核心。同时针对各个行业有解决方案,比如针对医疗行业的客户关怀信息的管理,比如说针对医疗行业有电子化的局域信息管理,在上面都定制可重复利用的资产,可以快速实现这种信息的部署和实现。在全球还有一大类的客户就是大量在医疗领域行业制造的客户,包括我们想到的强生等等都是我们的大客户。同时在大的趋势上面不断地发生跟云和大数据领域的整合,不断从其他领域获得数据,从客户端层面不断支持移动终端,比如现在的版本可以支持在IPAD上应用,可以跟Google地图上的应用,这些都是新的版本面向新的信用的特点。
    前面简单介绍一下Informatica的平台。同时看到一个故事和一个场景,大家可能对Informatica主数据解决方案,特别是针对客户领域的解决方案有一个大致的理解。但是我们回过头来看,王嘉明好像不是太满意,因为他认为我的问题只是解决了一半,说你已经知道我是谁了,并且知道我很重要,已经开始给我打电话道歉等等一系列,让他觉得有一定的放松。但是他认为在信息保护领域还是得不到满意的答复,因为他认为我的信息还是能被看到。所以解决这些问题,我们下一步就要解决保护的问题,有关如何保护客户信息,使相关人员对的人看到对的信息,使这个信息更好发挥价值,同时能使企业资产得到保护,会交由我们专门负责数据安全的专员,INFABANK信息安全专员孙大山同志来介绍,谢谢大家。

责任编辑:王程程 来源: 51CTO
相关推荐

2012-11-13 13:58:19

Informatica大数据Hadoop

2011-08-05 16:40:56

Informatica大数据

2013-09-22 16:37:08

Informatica

2015-11-03 15:07:09

CDO大数据首席数据官

2013-05-27 10:55:17

2013-09-26 10:52:54

2013-03-19 13:40:09

大数据

2010-02-01 11:57:24

InformaticaSiperian

2014-09-30 11:02:08

Informatic但彬大数据

2015-03-16 10:06:51

2015-11-03 15:10:08

CDO大数据首席数据官

2014-02-18 10:31:57

Informatica主数据管理

2015-03-05 08:56:43

2011-07-05 15:12:39

Informatica大数据集成平台

2013-05-08 19:44:58

Informatica虚拟数据机大数据

2017-11-21 11:19:08

首席分析官首席数字官首席数据官

2020-01-15 12:16:45

大数据搜索引擎技术

2015-01-26 12:42:38

Informatica主数据管理

2013-11-28 13:58:24

Informatica主数据管理

2010-11-03 15:52:55

数据仓库
点赞
收藏

51CTO技术栈公众号