社区编辑申请
注册/登录
数据孤岛何去何从,主数据管理能药到病除么?
数据库 新闻
数据孤岛是熵增,而主数据管理则是熵减,如同孪生双子。任何熵减的工作都有反向做功,比如整洁的桌面、舒适的居家环境都需要付出额外的努力。

​01 数字化正长风破浪

新冠肺炎疫情当前,上海的封城之殇仍绕梁余耳,被称为疫一代的我们,算下来疫情下生活工作也有近 3 年了。如果说什么对我们的生活、工作方式改变的最大,那莫过于疫情了。​

▶︎  疫情,加速了企业数字化的进程

微观视角下,新冠肺炎疫情给普通人带来的是工作生活方式的改变,宏观视角下给企业带来的则是数字化的新要求。一些改变,润物无声,不留心注意,可能会觉得理所当然。

和新冠肺炎疫情发生前相比,越来越多的企业已经允许新员工以线上的方式参与入职和相关培训。甚至,跨地域部署团队已成常态,远程工作文化也越来越深入人心。

图片

新冠肺炎疫情让企业重新思考,数字化对于他们的意义是什么。越来越多的企业开始建设新的定制化系统,开始将线下的活动逐步地搬到线上。

为了支撑越来越多的数字化需求,企业需要越来越多的定制化系统,比如:

  • 人事部门需要定制化的招聘和绩效系统;
  • 财务需要定制化的回款、报销系统;
  • 研发效能团队则需要定制化的项目管理、进展跟进系统。

无独有偶,在国务院关于印发《“十四五”数字经济发展规划》的通知中特别强调:

数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态。

数字化转型正长风破浪,各行各业都迸发出各种定制化业务系统的需求。

当前时代处于一个技术大爆炸的时期,不同的技术范式和技术趋势层出不穷。你方唱罢我登场,此起彼伏,对于同一种问题往往有好几种技术理念和对应的供应商,这无疑也加重了当前企业技术栈的复杂程度。

草蛇灰线,伏脉千里,数据孤岛的问题在企业的数字化的征程中变得越来越严重,或成为企业的阿喀琉斯之踵,造成企业无法真的完成数字化转型。我认为,在漫长的企业信息化和数字化的过程中,主数据和主数据管理作为一个持续保持热度的技术范式,值得被重点关注。

02 数据孤岛成拦路虎

企业的成长之路,并非只是人数的增加,我想也是企业文化、协作和管理等机制的成长之路。

▶︎  数据也成了一座座孤岛

而在互联网如此发达的今天,这些无形的东西又通过企业信息化凝聚成了一座又一座的数据孤岛。

数据在不同部门相互独立存储,独立维护,彼此间相互孤立,在物理上形成了孤岛。目前银行业经常提的银保协同和开放银行等战略,都是希望能解决因为业务在不同部门而造成的物理性的数据隔离。

图片

除了物理性的数据孤岛以外,还有一种是在认知层面的的现象,即不同部门站在自己的角度对数据进行理解和定义,使得一些相同的数据被赋予了不同的含义,无形中加大了跨部门数据合作的沟通成本。

▶︎  数据孤岛的问题,到底是什么?

很明显,不管物理上的还是逻辑上的数据孤岛,它们的存在都不是好事,但它们真正的问题是什么?

简而言之,就是数据孤岛相当于天然的数据隔离,不同部门视角下的业务视图是不一致和不完整的。这将给公司业务的运营带来诸多挑战和不便。

在数据孤岛的存在下,每个团队最终都独立工作。他们只能访问自己的数据,所以那是他们工作的唯一数据。这创造了一个分裂的组织。各个团队在项目上不相互协作,这使得公司几乎不可能有共同的愿景。

在数据孤岛成为常态的环境中,透明和信任的文化是很难维持的。相反,企业中的管理者因为没有全局视角,基于本位主义,可能只会在专注于团队的目标,在团队之间制造竞争和对抗。这让组织内部门间的协作变得无比困难。

因为无法跨团队访问数据,在协作上造成的困难是内生性的。假设我们站在企业客户的视角思考,我们接触到的不仅仅是一种声音,这些声音可能来自市场部门,也可能来自销售部门,还可能来自解决方案部门,归根结底,大多数企业中是有多个客户接触点的。

这些跟客户的互动,是在各种客户旅程的不同阶段发生的。当这些部门的数据没有被打通时,企业的客户会被反复的“骚扰”。

没有什么比不同的人重复地跟”客户“讲述同样的事情更糟糕的体验了。

而数据孤岛的存在,不仅仅使得客户有糟糕的体验,也使得高效率团队变成一句空谈。数据没法自动地在各团队之间流转,而是被隔离在团队内部。这意味着需要数据的团队别无他法只能等待,直到他们意识到没有他们所需要的数据,再去寻找所需数据在组织内的位置。即使能顺利拿到数据并且进行分析,那些等待的时间也是入长江之水一去不复返。

▶︎  如何保证数据自身的准确性?

企业虽然意识到数据是最宝贵的资产之一,但是数据本身的准确性如何被保证呢?

企业通常会使用不同的软件收集关于潜在客户、客户和合作伙伴的信息,以期望对数据的价值进行挖掘。但是,当这些数据过时、不完整或缺失时,企业能从中获得的价值就会大大下降,不难发现,数据孤岛威胁着企业关键数据的准确性。​

如果每个需要相同数据的员工都把它保存到他们公司的存储文件夹中,这就浪费了宝贵的存储空间。浪费了存储预算的同时,也存储了不需要和不想要的数据,造成了很大的冗余,不仅不能提效还造成了成本的浪费。如果数据被精简到一个平台上,让该组织内的所有员工都能访问,那么它所消耗的空间就会少很多。

试图用孤立的数据来管理一个企业,就像试图在没有说明书的情况下安装一个复杂的家具,这是难度极大的事情。如果没有一个围绕数据的策略,持续地帮助企业缓解数据孤岛的问题,依据熵增定理,孤立的数据放置的时间越长,它就越有可能变成过时的,从而不准确、不可用。可是这样一来,企业的各种战略都会受阻,甚至成为影响企业存亡的严重问题。

03 主数据管理,是数据孤岛的苦口良药?

数据孤岛,本质是一个熵增的过程。

▶︎  任何技术和架构都不是银弹,不能一劳永逸地解决所有问题

主数据管理更像是通过高层发起,重新构建企业对于主数据的认知,形成围绕主数据的流程设计,所有源自数据孤岛中的信息联系在一起,形成组织内的公共数据,帮助企业对业务有一个 360 度全方位的了解,才能逐步缓解数据孤岛引起的并发症。​

从这个角度来看,主数据管理(MDM)之于数据孤岛,更像是一层业务抽象层,是一个由企业高层主导的计划,以确保组织的共享数据即主数据的一致性和准确性。

图片

▶︎  先搞清楚什么是主数据,才能有的放矢

这部分我想在回答什么是主数据管理之前,很有必要先来给你介绍下什么是主数据。

主数据,与参考数据和元数据一样,是组织中的一种关键数据资产。虽然在互联网上可以找到更复杂的主数据定义,但简单来说,主数据是驱动业务流程的实体,通过分析进行评估,并通过治理过程进行控制。

主数据是有关业务实体(比如雇员、容户、产品、财务体系、资产和位置等)的数据,这些实体为业务交易和分析,提供了上下文信息。实体是客观世界的对象(人、组织、地方或事物等)。主数据应该代表与关键业务实体有关的权威的、最准确的数据。​

一般组织的主数据,包括这几方面的数据。我整理到图中了,大家可以看下:

图片

▶︎  不同角度看主数据

横看成山侧成岭,从不同的角度看主数据,或许有更深刻的理解。

从运营或业期望务流程的角度来看,主数据通常代表可交易的实体。例如,如果我们看一个典型的从订单到现金的流程:客户使用资产(即自助服务终端,比如信用卡、电子钱包或第三方支付渠道)从位于某个位置的商店购买产品;客户、产品、商店地点、资产(斜体字)等都是主数据的例子。

此外,记录销售情况的财务账户,或该商店的员工也是主数据的一部分。虽然持有主数据的系统通常不记录交易,但它们持有一致的实体信息以确保业务流程不会失败。

从分析的角度,或商业智能的角度来看,主数据是组织跟踪或检查的实体。例如,为了报告同一商店的销售情况,可将与商店地点相关的每个财务账户的交易数据进行聚合,展示在一个仪表板上。在这个例子中,财务账户、地点、客户、产品(斜体字)是主数据。

虽然管理主数据的系统通常没有交易细节,但它们持有符合要求的维度和属性(即主数据),这些维度和属性被分析工具用来正确地汇总和分析数据,保证分析报告和仪表盘等是准确的。

从治理的角度来看,主数据是受到控制的实体。例如,隐私法规通常决定了客户、雇员或病人的数据应该如何被控制。资产和地点受风险管理政策的约束,比如应急计划,或资产管理政策。会计制度(如GAAP,IFRS)和财务法规影响着财务账户层次的设计和控制。

虽然持有主数据的系统通常不记录政策和治理细节(这是数据治理或 GRC 平台所提供的),但它们在被治理团队所定义的实体范围之内。

以制造企业为例,我们主要关注制造业特有物料或物料分组,通常它的 PLM 系统是对产品的全生命周期进行数据管理,涵盖了组成零件、设计图纸、工程图纸、工艺文件、产品文件、材料等在内的和产品相关的所有数据。

这个例子中,围绕产品生命周期的原材料、制造零件、外购件、标准件等都是主数据的一部分。此外还有源于 ERP 系统和 MES 系统中的企业内部基础数据,通过对于 PLM、ERP 和 MES 系统,共享数据的整合,能够对制造业“供产销”的业务流程进行管控和降本增效。

04 借助主数据管理,组织在可以哪些方面借力?

▶︎  主数据管理的理解上,有必要再往深里挖

只有做到对主数据实体和标识符的控制,才能保证在系统间实现对核心业务实体最准确、 最及时的数据的一致使用,而这一过程就被称之为主数据管理。

我想,只是了解到这一层还不够。咱们再来看看 Gartner 对”主数据管理“是怎么定义的:

一个技术支持的知识领域,在这个过程中业务和技术协同工作,以确保企业官方共享主数据资产的统一性、准确性、管理性、语义一致性和问责性。主数据是由标识符和扩展属性组成的一个一致且统一的集合,它描述了企业的核心实体,包括客户、潜在客户、企业员工、供应商、位置、层次结构和会计科目等。

我们再具体细看下,Gartner 的这个定义里,强调了什么:主数据管理是一个由人、流程和技术组成的知识领域,并不是一个特定的应用程序解决方案。

然而,MDM(主数据管理)这一缩写词,却通常被用于特指管理主数据的应用系统或产品。主数据管理应用系统,可以简化主数据管理的一些方法,有时还非常有效。不过,仅仅依靠使用主数据管理系统,并不能保证被管理的主数据能够满足组织的需要。

如果说主数据是企业内不同业务的共享数据,那么主数据管理则是企业的制度和流程。

▶︎  借力 | 提升整体生产力,优化供应链管理成本

实际上,实施了主数据管理的企业,等同于在尽可能消灭数据孤岛的前提下,重构了整个企业的指挥和协作体系,重新建立了不同部门对于业务的共识,提升了整体的协作程度。

主数据管理可以提供一个关于客户主数据、产品主数据和关键主数据实体之间关系的统一视图。统一视图,能帮助企业的销售人员对于来自不同渠道上的客户,做出合适的引导来增加收入。

借助主数据管理,可以通过在整个组织中提供完整、一致、可靠的主数据来源,消除 IT 开销和成本,提高运营效率,提升整体的生产力。

主数据管理提供了对产品的集中视角,并提供了贯穿整个供应链的库存、产品退货和缺货物品的准确信息,从而改善库存管理、预测和客户服务,优化供应链的管理成本。

▶︎  借力 | 企业可更快推出新产品、服务,提升客户满意度、业务合规性

主数据管理,通过允许业务用户直接访问、管理和直观地与主数据互动,可以加快洞察和行动的时间。有了更丰富的产品、客户和供应商数据来源,企业可以更快地推出新产品和服务。

除此之外,企业还可以通过主数据管理对客户的具体愿望和需求有一致性理解,通过个性化的互动,提供跨渠道的一致体验提升客户忠诚度,同时根据定制产品和服务来增加销售。这些举措,无疑能帮助企业提升客户满意度。

最后,集中和完整的主数据,有助于降低与合规性报告和处罚相关的成本,提升业务合规性。通过主数据管理,供应商和产品合规性问题减少,也进而加快了新产品的推出和供应商的参与速度。

05 结语

数据孤岛是熵增,而主数据管理则是熵减,如同孪生双子。任何熵减的工作都有反向做功,比如整洁的桌面、舒适的居家环境都需要付出额外的努力。

曾经跟圈内朋友讨论数字化转型和主数据管理在国内实践的问题,大家普遍的回答是在数字化转型项目开展到深水区之后,才发现是原本一开始的主数据没定义好,又回头返工把主数据和主数据管理的这些基础设施工作做好。

▶︎  延伸思考

可是如果一开始,我们能向企业高层正确地灌输主数据正确的认知和其好处,后续的很多工作是不是往往就可以避免甚至是提速完成了。数据孤岛是企业的拦路虎,而主数据管理则是苦口良药。

如果需要药到病除,需要一个好的主数据管理软件和高层的支持。这两者缺一不可。

一般而言主数据管理的关键处理步骤,包括数据模型管理、数据采集、数据验证、标准化和数据丰富、实体解析、管理和共享等。

图片

这也对主数据管理的软件提出了不同的要求,一个好的主数据管理软件,是可以让主数据管理在企业中落地时事半功倍的。而高层支持,则需要对主数据和主数据管理有正确的认知,且能够一起推动企业的变革。

今天的分享到这里就结束了,希望今天你可以有一定收获。​

责任编辑:张燕妮 来源: ITPUB
相关推荐

2022-05-26 11:50:15

2022-04-17 23:02:08

数据分析数字化转型人工智能

2022-03-18 14:38:09

隐私计算数据孤岛安全

2009-12-08 14:26:13

大型网络运维

2022-06-29 16:40:48

科学计算

2022-05-24 14:17:12

Commvault活动回顾

2022-06-24 22:33:36

Qlik数据主动智能

2020-04-15 14:07:13

保密管理系统金航数码

2022-07-01 05:58:38

开源技术开源

2016-09-18 10:56:30

捷思锐

2020-09-27 14:40:10

超融合

2022-06-20 10:37:31

物联网智能安防智能建筑

2022-06-15 11:01:24

云计算自动化IT

2022-03-01 23:37:47

云计算存储数据管理

2022-05-27 08:30:56

XDR扩展检测与响应网络安全

2022-02-14 13:59:47

2022-06-02 14:11:42

区块链药品供应链数据

2022-04-11 17:55:35

人工智能

2022-05-13 11:12:42

PingCAPTiDB数据库

2022-06-10 15:35:00

戴尔

同话题下的热门内容

一次非常有意思的 SQL 优化经历:从 30248.271s 到 0.001s横空出世的 Data Fabric,是下一个风口吗?字节云数据库未来方向的探索与实践面试经典问题,如何提高数据库的性能?从SQL到NoSQL,数据库还要向何处演进?提高分层 SQL 结构的性能这年头,谁还不知道这10个高级SQL概念?云时代下,数据库的关键趋势与DBA发展之路

编辑推荐

Oracle数据库初学者开场篇NoSQL数据库概览及其与SQL语法的比较如果对MySQL还停留在这个印象,就out了SQL编程之高级查询及注意事项防止服务器宕机时MySQL数据丢失的几种方案
我收藏的内容
点赞
收藏

51CTO技术栈公众号