社区编辑申请
注册/登录
成功进行数据迁移的策略
大数据
数据迁移是一个复杂且通常成本高昂的过程。企业将需要正确的方法来准确无误地迁移数据,其中包括深思熟虑的策略和适当的工具。

数据迁移是一个复杂且通常成本高昂的过程。企业将需要正确的方法来准确无误地迁移数据,其中包括深思熟虑的策略和适当的工具。

什么是数据迁移?

数据迁移是指将数据从一个存储系统传输到另一个存储系统的过程。它从数据选择和准备开始,在此期间进行提取和转换。在执行这一步骤之后,可以将永久数据从旧存储系统中选择并加载到适当的数据存储系统中。然后,数据迁移将以旧存储系统的退役而结束。

数据迁移通常属于以下两类:

  • 云迁移:数据或应用程序从物理存储系统迁移到云平台或在两个云平台之间迁移。
  • 数据中心迁移:数据从一个内部部署数据中心迁移到另一个数据中心以进行升级或重新定位。

在决定要迁移到哪里之后,接下来需要确定需要迁移的内容:

  • 存储迁移:数据从一种物理存储解决方案移动到另一种。
  • 数据库迁移:使用数据库管理系统移动结构化或数据库管理的数据。
  • 应用程序迁移:数据从一个计算环境迁移到另一个计算环境,以支持应用程序软件的变化。
  • 业务流程迁移:迁移与业务流程和指标相关的业务应用程序和数据。

为什么需要数据迁移?

企业选择升级其存储系统并随之迁移数据有几个原因,最终帮助他们获得竞争优势。数据库迁移可帮助企业克服存储限制,并可以促进更好的数据管理功能和处理速度。另一方面,存储迁移主要集中在升级以支持新技术。

企业可能会发现需要进行数据迁移的其他场景包括:

  • 希望升级到新的基础设施以弥补规模限制。
  • 希望优化运行数据中心的间接成本。
  • 需要在采集之后合并新数据。
  • 需要迁移数据中心。
  • 希望实施灾难恢复解决方案。
  • 希望将应用程序迁移到云中,原因包括易于维护和访问成本。

数据迁移的策略

提前制定战略将帮助企业节省成本并防止停机,以确保业务连续性。企业必须考虑限制并了解数据迁移项目的整体范围。在启动数据迁移项目之前,企业需要考虑两个关键因素,即规模和时间。

  • 数据大小:大多数数据集规模太大而无法简单地上传到云端,需要在物理设备上传送。这主要是因为速度和成本限制。企业可以通过硬盘驱动器发送10TB以下的数据,而PB范围内的较大数据则需要专门用于数据迁移的设备。
  • 时间限制:带宽、网络速度和限制以及数据集大小是计算数据迁移所需时间时的关键考虑因素。如果需要在物理设备上传送数据,则还应考虑其传输时间。

在考虑数据大小和时间限制之后,企业可以制定项目预算和时间表,还需要决定用于数据库迁移的工具和框架。这将为其概述数据迁移的整个过程。

此外,企业还需要决定迁移方法,即在“大爆炸”方法和“一蹴而就”方法之间进行选择;或选择循序渐进的方法,即分阶段迁移,其中两个系统同时运行。

数据迁移的关键步骤

数据迁移是企业将要进行的最关键的项目之一,每一步都需要认真谨慎。其复杂性背后的原因是企业不想损害数据质量,否则数据驱动的业务将在核心运营中出现错误。

经过规划,数据迁移大致有五个阶段:

(1)数据准备涉及一些旨在使数据适合迁移的关键操作。从审计开始,将运行一个自动化流程来分析数据质量,并通知不一致、重复条目或健康状况不佳的情况。接下来,备份文件并建立访问级别。

(2)数据映射涉及匹配数据源和新目标之间的数据字段匹配。

(3)执行是数据被提取、处理和加载到目的地的地方。

(4)在理想情况下,测试是数据迁移中的一个连续过程,尤其是当分阶段迁移数据时。在整个迁移过程完成之后,需要运行另一次自动化测试迭代,修复问题并继续上线。

(5)有必要在数据上线后再次审核,以确保成功完成。企业还应该及时进行审计并监控系统的运行状况。

迁移工具

有许多工具可以帮助企业完成迁移过程。许多云计算提供商提供自己的一套工具。其他工具,包括几个免费和开源应用程序,例如Salesforce公司的DataLoader也可用。与迁移类型一样,迁移工具可以是自脚本、内部部署和基于云的。其他主要工具包括亚马逊的AWS数据管道、IBM Informix和Microsoft Azure CosmosDB。

数据迁移的挑战

数据迁移本质上是复杂的,在企业中执行这一项目时可能会遇到一些挑战。

  • 不包括相关方可能会中断企业的业务活动和数据迁移过程。每周让他们更新进度。
  • 缺乏数据治理或不清楚谁可以访问源系统中的数据,可能会造成混乱并影响数据质量。一个明确定义的数据治理框架对于克服这一挑战至关重要。
  • 通用且未经证实的迁移方法可能弊大于利。始终寻找可靠的推荐支持服务提供商,并选择经验丰富的团队。
  • 技能不足和工具不足都会导致意外的延迟,并耗费宝贵的时间。进行适当的研究,确保负责数据迁移的团队得到充分的培训,并拥有所有必要的工具。
  • 计划是必不可少的。计划本身可能不足以保证成功迁移,但却是必要的。

准备好迁移数据了吗?

虽然数据迁移听起来可能不会太令人生畏,但这是一个复杂的过程,必须事先弄清楚许多变量。因此,企业需要一个专门的团队来执行和监控数据迁移过程,并将其视为一个重大项目。

企业还可以利用多个高级和开源应用程序来帮助进行数据迁移。与迁移类型一样,迁移工具可以是自脚本的、内部部署的和基于云的,将为企业提供足够的灵活性,以最适合的方式进行数据迁移。

尽管这是一项艰巨的任务,但只要考虑清楚,就可以毫不犹豫地继续进行。

责任编辑:赵宁宁 来源: 企业网D1Net
相关推荐

2022-05-16 19:45:22

云迁移云计算

2022-03-02 18:23:15

云迁移云计算

2022-04-15 06:13:38

云成本云转型云计算

2022-05-24 12:16:36

存储迁移存储层diff

2019-06-24 15:00:52

数据迁移数据转换数据集成

2022-05-30 10:20:51

数据迁移

2022-05-26 05:06:20

数据库云端数据

2022-06-24 12:23:49

数据战略Cloudera云迁移

2020-02-14 09:30:36

云迁移数据中心云计算

2022-04-15 19:36:18

云迁移云计算

2022-03-01 18:21:27

云迁移云服务

2022-03-07 14:10:13

云数据仓库云迁移云原生

2022-03-22 10:24:48

Linux开源Elasticsea

2015-01-26 14:15:06

2020-12-29 10:53:25

云迁移云端云平台

2022-01-19 12:23:36

2022-01-10 09:59:36

2022-06-09 10:23:06

数据库迁移方案

2015-01-12 13:20:16

数据中心迁移

2021-01-26 10:52:35

同话题下的热门内容

大数据分析技术和方法有哪些?如何构建准实时数仓?大数据如何成为元宇宙的基石节日消费数据不“杀熟”?大数据带你一起“解”七夕!五个方法,破解数据分析的核心难题中原银行实时风控体系建设实践聊聊数据分析的价值是什么?大数据的过去正在颠覆人们的未来

编辑推荐

使用Pandas&NumPy进行数据清洗的6大常用方法2018年7款最佳免费数据分析工具pyspark访问hive数据实战【漫谈数据仓库】 如何优雅地设计数据分层人工智能、大数据与深度学习之间的关系和差异
我收藏的内容
点赞
收藏

AISummit人工智能大会