如何创建有效的数据归档策略

存储 存储软件
组织选择正确的数据存档策略可以通过多种方式获益,以下是如何做到这一点的提示。

 组织选择正确的数据存档策略可以通过多种方式获益,以下是如何做到这一点的提示。

[[330565]]

存储厂商StorageSwiss公司前任首席分析师、StorONE公司现任首席营销官George Crump表示,尽管数据归档对于大多数组织非常重要,但并非所有组织都拥有数据档案。其原因有很多:决策者可能不了解归档的价值,也不了解备份与归档之间的区别,归档可能过于复杂,也可能被认为成本过高。

他指出,任何一家拥有超过25TB数据的企业都需要制定数据归档策略。

Crump说,“这并不是组织为了在主存储方面节省成本,而是因为必须能够证明其数据保留,而且随着通用数据保护条例(GDPR)和加州消费者隐私法(CCPA)等法规的生效,这一点将变得越来越重要。”

数据归档还有其他好处,其中包括归档数据通常存储在成本较低的存储层上。另外,数据归档有助于防止数据丢失。

另一个原因是免受勒索软件的侵害。通常来说,这是因为归档数据更难访问。例如,一家组织将其500TB数据中的300TB存档之后却遭到了勒索软件攻击,而其存档的300TB数据没有受到损害。

数据归档还可以使实时数据集规模更小,从而使其更容易、更快捷地进行处理。例如,如果组织通常只搜索前一年执行的交易,那么在实时存储系统中保留10年的交易价值将使其速度变慢并且花费更多成本。

以下是创建适合组织业务的数据存档策略的一些技巧:

(1)组织知道自己拥有的数据。组织在归档任何内容之前,必须知道拥有哪些数据。有很多工具可以帮助完成此任务,但是许多工具都依赖于平台。例如,如果组织运营Windows文件服务器,则它可能需要采用与NetApp设备不同的工具。但是也有一些不可知的工具,其中包括SolarWinds和Clear Technologies的工具。

(2)在做事之前仔细考虑。在购买任何东西之前,需要了解谁将使用它,将要归档哪些数据、数据访问频率以及如何更新、访问和控制归档。

技术研究和咨询机构ISG公司首席顾问Cindy LaChapelle说,确定数据的访问频率至关重要,因为这可能决定组织选择的平台类型和所需的响应时间。

她解释说:“如果存档在云平台中运行,但是所有数据的原始副本都存储在数据中心中,然后再调用这个基于云计算的数据归档,则可能需要担心延迟问题。因此,有很多技术参数需要根据谁将访问数据、恢复数据的频率和要求来测试。”

(3)根据所有增长中的数据必须保留在实时系统中的时间,为其分配保留时间表。澳大利亚Rapidap公司技术服务总监Gi Singh解释说,“例如,如果使用信用卡为交易支付费用,则应根据客户可以在多长时间之后对费用提出异议,并增加一些应急措施。”

他补充说,在确定保留时间表时不要进行假设。取而代之的是,与组织各个领域的数据用户沟通,以制定保留时间表,并在实施之前获得他们的批准。

例如,营销团队可能有图像、视频和音频要存档,但是只有营销团队才能知道它需要多长时间才能恢复这个存储媒介,以及该媒介在存档之前应可供其部门使用多长时间。因此,IT团队必须与市场团队一起创建技术解决方案。组织的其他团队也是如此,例如法务和财务等部门。

(4)选择适合的软件。涉及数据归档时有三个基本选项:组织可以自己完成开发,使用可以为其标识和移动数据的软件,或者使用可以标识和移动数据并建立指向其数据链接的软件。

  • 自己开发:使用这种方法,组织的IT员工可以使用PowerShell或Python脚本开发数据库。然后只需确定数据并发出移动命令,当然要确保首先备份数据。
  • 中间路线:使用软件解决方案来分析整个环境中的数据,并根据组织的策略和要求为其自动识别和移动数据。
  • 完整方案:这些解决方案可以完成所有工作,自动识别和移动数据,并在需要时包括自动召回。这意味着可以将文件或云平台中的文件或对象重新访问存档的数据。这使恢复非常简单。

组织选择的选项取决于许多因素,其中包括IT专业人员的技能、花费的费用以及所需的功能。

Crump说:“随着这些类别的增加,其成本变得越来越昂贵,并且从设计的角度来看变得越来越复杂。因此,如果企业具备编写脚本的技能,那么人工方法就很有吸引力。否则,他们必须在第二种方法和第三种方法之间做出选择。”

在这两种自动方法之间选择取决于组织真正希望多久调用一次数据,这很难弄清楚。Crump说,他建议组织每隔一个月将其数据快照进行比较。

组织需要确定其人工操作的费用。一般来说,人工操作环节越多,费用就越多。

Crump说,“我已经看到很多组织决定从人工操作方法开始,如果需要完成更多工作,他们将转向采用自动化的解决方案。这是一个很好的策略。”

组织对购买的存储容量需要具有策略性的考虑,因为不需要采购过多的存储容量。例如,如果组织中有500TB的数据,则分析可能会表明,其中300TB的数据已超过一年未被访问。当一个需要50TB存储空间的项目启动时,只需将存储时间最久的50TB数据移动到存档中,即可释放所需的容量,而无需花费更多的费用。

组织需要经常重新审视归档策略。保留策略、业务优先级、安全问题、政府法规和技术经常发生变化,而且组织的数据归档策略应该与时俱进。

LaChapelle说:“如果一个组织在多年前创建了数据档案,它甚至可能没有关于数据的保留策略。但是如今,有关于在特定时间范围内删除个人数据的法规。这可能会影响存档中的许多数据集,如果从一开始就没有对它进行分类,则可能必须对存档数据进行一些重新分类。”

Singh表示,组织在评估当前的数据归档策略时,一定要问自己这些问题:

  • 数据安全吗?
  • 存档数据是否持久?
  • 如果业务需要,是否可以访问或恢复?
  • 系统或用例是否已更改?
  • 合规要求是否已更改?
  • 成本是否发生变化?例如,现在在云平台中归档的成本是否比在内部归档的成本更低?成本在未来几年将会发生什么变化?
  • 文档是否是最新的?

创建数据归档策略不必过于昂贵或复杂,而数据归档在合规性和安全性的回报是值得的。

 

责任编辑:华轩 来源: 企业网D1Net
相关推荐

2021-09-28 13:32:01

大数据大数据战略数据策略

2023-12-19 15:53:53

2022-10-21 16:11:52

数据治理安全IT

2018-05-08 10:00:00

大数据模型技巧

2023-03-24 12:37:16

数字供应链数字化转型

2022-10-28 15:30:27

大数据大数据模型

2023-02-19 15:28:39

CI/CD 管道集成开发

2021-01-21 09:00:00

物联网架构数据

2023-08-22 15:44:33

2023-01-31 15:46:40

数据质量大数据数据库

2021-06-22 14:10:16

主数据管理数据治理

2021-12-27 09:00:00

数据泄露安全数据丢失

2012-08-01 14:18:19

IBMdW

2020-03-12 11:35:32

数据备份恢复策略

2024-04-11 12:58:39

2012-04-16 10:16:07

云计算私有云IaaS

2014-08-05 09:50:20

2022-05-26 05:58:23

数据驱动业务数据分析

2022-06-07 08:19:30

gRPCBallerina微服务

2019-05-24 11:32:54

云计算成本管理云平台
点赞
收藏

51CTO技术栈公众号