数据安全:建立业务词汇表原因和方法

安全 数据安全
如果想在整个组织中鼓励数据驱动的决策制定,那么构建业务词汇表是必不可少的。通常,在使用中会有多个术语和定义,过程有些复杂。这就是为什么必须启动数据目录以使流程运行更顺畅的原因。

介绍

数据治理业务词汇表是必不可少的数据素养工具,对于理解组织中的数据和进行有效分析至关重要。如果没有业务术语表,公司通常会被使用的大量相互冲突的术语和定义所淹没。如果没有标准化,组织将全面遇到阻碍关键业务流程的障碍。

业务词汇表使用户能够找到常用术语和定义,更轻松地就数据资产进行协作,并顺利推进数据驱动的增长计划。建立业务词汇表并不容易,需要一个专门的工具来完成此过程。

在尝试确定要为业务词汇表优先考虑哪些术语时,有时无法使用分析用法和技术重要性等方法。相反,可以创建一个调查来查找哪些术语对组织很重要。使用提供的调查问题来全面了解需要通过数据治理定义的重要术语。不要害怕给自己添加问题!

商业词汇基础

什么是商业词汇?

一种商业词汇将与数据相关的术语和定义汇集在一起,并清晰、合乎逻辑地显示它们,以便组织中的每个人都可以访问它们。标准化是数据素养最重要的组成部分之一,也是在任何组织中开发业务词汇表的关键驱动力。

 问题是,想出一个定义很容易,个别用户和部门倾向于采用相互矛盾的术语,很难与多个个人和部门协调,从一开始就建立共同的术语很重要。 

随着时间的推移,随着越来越多的术语被使用,公司的数据资产变得非常难以导航,使得用户几乎不可能使用他们不熟悉的数据资产进行协作和创新。业务词汇表通过引入组织中每个人都能理解的标准化术语和定义来消除这种混淆。

商业词汇表的要素是什么?

尽管业务词汇表的核心目标是标准化组织中的术语,但构成其元素和用例很多。这些包括:

  • 术语和定义——因此业务用户可以从一致性中受益,并快速轻松地更好地理解数据资产
  • 数据分类——用户可以根据数据的分类方式搜索、识别和查找数据之间的关系
  • 参考数据——因此数据治理组可以在微观层面对数据进行分类
  • 技术元数据——因此经验丰富的数据分析师可以在上下文中分析数据资产

但是,重要的是要注意,每个组织都会有他们希望通过实施业务词汇表来实现的特定用例。即使只认同我们上面介绍的一两个元素。很可能会有更多特定于组织的内容。

Business Glossary 经常与……混淆,但不是……

许多用户可能会发现很难区分业务词汇表和数据字典。但是,虽然两者相似,但它们并不是同一种资源。

简而言之,业务词汇表的作用是定义术语,以便用户可以轻松识别并使用其进行协作。另一方面,数据字典旨在通过设置和执行各种数据标准、记录来源、格式和关系来实现数据库的平稳运行。

一些用户可能还会将业务词汇表与数据目录混淆。同样,尽管有一些相似之处,但也存在显着差异。本质上,数据目录支持创建业务词汇表。

正如数据目录爬取公司的所有数据源,并将数据资产整合到一个集中的、可搜索的数据库中。正是这种整合使数据团队可以轻松找到相互冲突的术语和定义。

拥有业务词汇表的主要好处

在组织中建立业务词汇表有几个重要的业务优势。以下是最重要的几点。

1. 促进理解

借助活跃的业务词汇表,用户可以快速轻松地找到术语的定义,从而更容易理解数据集。例如,如果业务用户需要访问另一个部门的报告,其中包含部门外未知的术语,他们可以在公司的业务词汇表中查找该术语。

想象一下,如果 R&D 的业务用户想要访问财务记录以简化成本并进一步扩大他们的年度预算。如果他们访问财务部门持有的数据,可能会使用许多对他们来说不常见的术语,这使得破译数据的任务几乎不可能完成。当这些术语被标准化并列在业务术语表中时,整个过程就会变得更加简单。

2. 改善部门之间的沟通

有效的沟通对于数据驱动的创新至关重要。业务词汇表使与其他部门的沟通变得容易,同时避免了对特定数据术语的混淆。

例如,在医疗保健部门,没有标准定义来计算医院的“住院时间”,这是每家医院在其年度资产负债表中报告的内容。当每家医院收集数据的方式和计算住院时间的方式不同时,如何汇总这些数据?

这一点使得合并很难发生。一家医院可能将住院时间定义为患者进入医院的那一刻到他们离开时的时间,而另一家医院可能将其定义为在特定病房或从第一次与医生会面开始的时间。

3. 降低操作复杂性和混乱

业务词汇表自上而下解决运营问题。如果没有这个工具,解读相互冲突的术语可能会非常耗时、昂贵且对每个部门都有影响。

当术语标准化后,不一致的情况就会减少,每个人都可以更有效地访问和使用数据。

这减轻了数据团队的压力,因为他们不负责制定冲突数据术语的关系和定义。反过来,从数据的角度来看,企业的日常运营也得到了简化。

4. 提高生产力和信任度

当用户信任数据时,他们更有可能使用它来做出更好、更高效的业务决策。但是,当组织中使用相互冲突的术语时,用户不仅避免访问数据资产,而且无法理解他们实际访问的内容。

业务词汇表阐明了这些问题,也减轻了数据团队的压力,因为业务用户可以通过自助服务独立访问这些信息。结果是整个公司的生产力提高。

例如,如果用户决定访问与其部门相关的客户数据并齐心协力改善服务,那么当他们发现的数据中充满了相互矛盾的信息时,他们很可能会被推迟。标准化术语使用户更容易具备数据素养,因为他们需要的信息被明确定义。结果是使用公司数据资产进行更多创新。

5. 建立所有权

的一个关键方面数据治理正在确定数据所有者并确定数据资产的责任。这有几个关键的结果。当知道数据属于谁时,可以直接联系数据保管人并更快地访问数据。

当用户知道他们对数据负责时,他们可以持续努力确保其质量,这最终对整个组织都有利。第三,建立数据所有权使数据资产更易于分类和组织。业务词汇表能够快速轻松地记录数据所有者并更新对此所有权状态的任何更改。

如何建立业务词汇表

构建业务词汇表的第一步是询问是否使用了多个术语。理想的情况是已经存在标准术语的情况,但通常情况并非如此。当不同的部门使用不同的术语和定义来解释同一件事时,需要一种自下而上的方法。

  • 使用此模型的企业需要创建一个数据治理组。该组的功能是标准化组织中使用的术语。
  • 这是一个巨大的挑战,因为成百上千的报告已经在使用这些术语。治理组必须确定术语的使用位置、术语的使用方式以及谁在使用它们。
  • 通过分析,可以识别和整合组织中最关键的术语。
  • 获得这些信息后,您需要与这些术语的用户进行协调,以通过共识确定标准定义。最后,需要让组织中的每个人都了解新的标准术语和定义,并将它们输入到业务词汇表中。

展望未来,无论何时添加新数据元素,都应由将创建标准定义的治理组签署。

如果组织中没有现有的数据术语和定义,则可以采用自上而下的方法来构建业务词汇表。当使用中没有冲突的术语和定义时,构建业务词汇表的过程要容易得多。

  • 需要建立一个包括高层管理人员和关键利益相关者的数据治理小组。
  • 治理小组将确定组织中可能使用的术语,最终确定这些术语的定义,然后将其添加到业务词汇表中。同样,这些决定需要社会化,以便组织中的每个人都知道并可以访问。
  • 每当用户希望使用特定术语时,应该访问业务词汇表,并使用那里的标准定义。

当然,理想很丰满,现实很骨感,大多数组织做的都不太好。使用中可能会使用不同的术语,尤其是在公司正在经历一段并购时期的情况下。

考虑自动化业务词汇工具

到目前为止,实施业务词汇表的最佳方式是使用自动化数据治理工具。事实上,在必须承诺(大多数人都会)采用自上而下实施方法的组织中,如果不这样做,该过程几乎是不可能实现。

实施数据目录的最低成本远远超过手动尝试这一严格过程所花费的时间和金钱。

全面的数据目录,例如椭圆边缘,包括在组织中设置业务词汇表所需的所有工具。使用 工具查找、索引和汇总组织中的所有数据资产,因此在构建业务词汇表时,可以轻松获得所需的所有信息。

采用数据目录的角色最好留给数据治理组。数据目录爬取组织中的所有报告、查找术语并对其进行编目,同时还在相互冲突的定义之间建立关系。

使用数据目录,可以快速识别组织中的核心数据所有者和利益相关者。如果没有数据目录,该过程不太可能工作,因为不断创建和更新相互冲突的术语。

结论

如果想在整个组织中鼓励数据驱动的决策制定,那么构建业务词汇表是必不可少的。通常,在使用中会有多个术语和定义,过程有些复杂。这就是为什么必须启动数据目录以使流程运行更顺畅的原因。

创建业务词汇表的责任落在数据治理小组身上。因此,选择加入小组的人必须代表整个组织的利益相关者。实施成功的业务词汇表的最大障碍之一是个人或部门偏见。因此,必须拥有一个代表组织中每个人的数据治理组。

人的偏见,往往根深蒂固的,在一项人人参与特别是参与过一些不成系统体系工作的人心中,其经验不具有可推广传播性,但是他又守着不成熟的可怜的那一点点经验不放,能给组织带来非常大的伤害。这类人为何不愿意放弃这种偏见呢?究其原因,他也就这么多内容,不愿意接触新事物,惧怕新事物、惧怕改变吧。

责任编辑:武晓燕 来源: 祺印说信安
相关推荐

2011-03-22 15:16:16

数据库专用词汇

2020-12-17 09:50:55

CIO首席信息官IT

2023-12-13 13:35:50

数据驱动数字化转型数据分析

2019-03-29 14:06:15

网络服务服务供应商NSP

2023-10-23 10:09:32

2021-02-07 09:29:39

数据安全网络安全漏洞

2023-03-27 09:45:05

2020-03-14 13:13:02

物联网IOT通信协议

2011-08-01 16:31:29

MySQL数据库外键

2010-01-27 10:26:57

2010-06-12 16:30:51

UML设计

2019-03-01 17:55:59

企业云计算云平台

2018-04-12 07:10:23

2011-02-25 09:14:27

2022-02-28 17:43:27

AI模型训练

2013-01-08 09:36:00

大数据大数据热门词汇

2020-03-04 10:51:35

Python算法脚本语言

2014-04-24 09:46:47

数据分析

2020-03-04 14:01:31

戴尔

2022-05-31 06:04:14

数据治理数据安全
点赞
收藏

51CTO技术栈公众号