社区编辑申请
注册/登录
详解数据管理发展的五个阶段
大数据 数据分析
从历史的视角看,数据管理是一个不断进化发展的过程。其发展路径大致可以分成五个阶段:数据的可用性、数据的聚合、数据可视化、数据服务可编排、由AI驱动的自动化。不同的企业可能处于不同的发展阶段。

近年来现代化企业都在改革现有的数据管理体系,优化原有的基于策略定义的数据管理模型,逐渐开始使用基于数据使用行为的数据管理方式。以确保数据不仅可用,而且保持活性,从而始终让数据资产充分发挥本身价值。

从历史的视角看,数据管理是一个不断进化发展的过程。其发展路径大致可以分成五个阶段:数据的可用性、数据的聚合、数据可视化、数据服务可编排、由AI驱动的自动化。不同的企业可能处于不同的发展阶段。

一、数据的可用性

在第一阶段,有关数据的一切活动都是基于数据的可用性的。数据保护是一切数据管理行为的基础,为之后的数据使用行为提供保障。数据备份、数据复制及安全保留是数据保护的核心要素,以保证数据的可用性。

如今,云计算架构已经发生了翻天覆地的变化,从架构上来说,数据块的副本可以瞬时产生,为什么还需要备份呢?

原因是:现在很多企业的数据备份架构还是像以前那样简单粗暴,即通过数据拷贝的方式,进行数据副本的存放。这并不能称之为备份,因为数据本身是有状态的,并且在进行数据保护的时候,要保证数据的一致性、有效性以及可恢复性。

这与应用在使用被恢复的数据时的行为强相关,为了使数据在被恢复以后可以灵活地被应用所使用,在第一阶段要对数据管理平台进行面向应用的适配与优化。

二、数据的聚合

在第二阶段,企业开始深入了解数据,利用它们为企业创造价值。此阶段的目的是确保在多态的数据中心,即跨物理、虚拟、云等架构与应用平台,以与云环境适配的数据格式和松耦合的方式存储数据,从而使企业更容易进行云化的集中管理。

同时,这不仅仅发生在基础架构层面,还涉及与多种应用的适配。通过集中控制,企业可以在各种基础架构上更流畅地工作,并快速访问数据。为今后数据的利用和应用的读写分流提供基础。

三、数据可视化

在第三阶段,企业已经进入数据使用行为可视化阶段,被动的数据管理转变为主动的关注数据使用行为的方式。相对而言,数据管理早期阶段的重点是始终保持业务在线与数据安全。

在第三阶段,企业更加关注数据的使用行为是否合规,并且已经在数据管理平台之上为数据使用行为定义了入口与服务目录,这使企业在数据管理与使用的竞争中保持领先。在此阶段,数据管理为企业提供了更广泛的策略支持。

四、数据服务可编排

在第四阶段,企业更加注重数据管理与使用效率。数据管理与使用的重复性与复杂性,以及由人工误操作带来的潜在风险,使关注执行效率的企业更偏向于将企业频繁使用的数据服务形成可编排的流程,这也为数据使用的合规性提供了重要的保障。在数据管理越发复杂的今天,我们需要简化数据管理的界面,统一服务端口。

五、由AI驱动的自动化

在第五阶段,数据管理的多数场景会转为由人工智能和机器学习来驱动,机器学习引擎会根据企业的实时业务需求自动备份、恢复和迁移数据。尽管对于大多数企业而言,数据管理完全自动化还需要几年的时间,但有些企业已经开始利用新技术来支持其数据管理策略。例如:十年前,地震可能会导致关键数据不可逆转地丢失。

在现代化的数据管理平台之下,一方面,通过物联网传感器捕捉震颤迹象来保持数据中心的安全已经被定义为日常运维事件,这将触发数据复制与切换机制;另一方面,不同级别的灾难恢复所需的花费不同,AI系统会在风险较低的情况下减少灾备中心的资源配置,从而控制企业的灾备总体成本。

小结

如果将数据管理的五个阶段视为每个企业都会走过的旅程,企业更应该关注的是数据管理目前所在的位置与阶段,并设定下一步发展目标,科学地设定里程碑与关键的复盘时间点,保证设定的目标可以实现。

在这段旅程中,企业更应该注意数据管理当前的发展情况,以及在当前状态下如何有效地利用现有环境实现数据的资产化。

关于作者:魏磊,Veeam Software资深系统工程师,长期从事虚拟化和云计算基础架构及数据管理相关工作,为客户提供虚拟化和云计算基础架构的技术咨询,擅长VMware数据保护解决方案设计。

张聪,Veeam Software云解决方案架构师,负责Veeam云数据管理业务的技术支持。技术专栏作者,热爱技术知识的学习与分享,熟悉多种容灾、数据管理解决方案。加入Veeam Software之前,就职于多家国际知名公司,曾作为架构师为客户设计并实现多个云管理及云灾备即服务平台,有着丰富的云端数据管理经验。

邬小亮,Veeam Software系统工程师,在数据备份恢复领域已工作十余年,一直致力于操作系统、数据库和虚拟化层面的备份、恢复、容灾方向的学习和研究,项目实战经验丰富。

本文摘编自《云数据管理实战指南》(ISBN:978-7-111-67539-6),经出版方授权发布。

责任编辑:武晓燕 来源: 大数据DT
相关推荐

2022-06-05 21:09:47

Python办公自动化

2022-06-15 11:02:40

网络安全运营

2022-06-15 08:25:07

Python天气数据可视化分析

2022-06-01 14:35:39

gitjmeter脚本

2022-05-12 14:44:38

数据中心IT云计算

2022-06-16 15:42:16

攻击面管理ASM

2022-06-21 10:04:25

数据中心智慧城市

2022-05-30 00:16:47

Python技巧pip

2022-06-22 05:53:49

城域网广域网VXLAN

2022-05-23 13:30:48

数据胡实践

2022-06-27 15:25:08

架构模型治理

2022-06-16 17:02:49

微软智能云混合云Azure

2022-06-07 14:25:23

2022-05-29 22:56:13

2022-06-29 14:46:00

网络攻击数据泄露勒索软件

2022-06-23 14:03:26

混合ITCIOIT管理工具

2022-05-16 11:50:45

HDF驱动框架

2022-05-24 15:06:57

AbilityeTS FA鸿蒙

2022-05-24 14:50:22

存储可持续数据存储数据中心

2022-06-02 15:28:42

网络安全信息通信数据保护

同话题下的热门内容

七个好用常见的大数据分析模型如何用好数据科学?七张图,学会做有价值的经营分析Apache Doris刚刚 "毕业":这个SQL数据仓库有什么不一样?一文看懂:数据指标体系的四大类型

编辑推荐

什么是数据分析的漏斗模型?数据分析师还吃香吗?用数据告诉你对比解读五种主流大数据架构的数据分析能力《狄仁杰之四大天王》影评分析(爬虫+词云+热力图)22个免费的数据可视化和分析工具推荐
我收藏的内容
点赞
收藏

51CTO技术栈公众号