如何将SQL数据库迁移到NoSQL

译文
运维 数据库运维
本文首先比较了关系型数据库和NoSQL数据库的各种特点和适用场景,然后介绍了如何使用云服务提供商提供的各种工具,将SQL数据库迁移到NoSQL。

[[378796]]

【51CTO.com快译】您知道关系型数据库(RDBMS)与NoSQL数据库的本质区别和适用场景吗?

总的说来,RDBMS主要管理、存储和操作的是结构化的数据。其中,数据格式、列、数据类型、属性和模式都是固定的。而且实体之间的关系也基本保持一致。在使用RDBMS来存储事务型数据或记录时,底层数据库除了必须保证事务的ACID(原子性、一致性、隔离性、耐久性),此外还需要重视数据的安全性和可访问性。RDBMS的典型适用场景包括:财务交易记录、OLTP、ERP、CRM系统、以及电子商务应用等。而SQL是处理RDBMS时常用的查询语言。

NoSQL(有时也称为非SQL或非关系型)数据库是一种适用于管理非关系型数据(即:具有固定数据类型格式和变量,但不以表格格式来结构化数据)的数据库。NoSQL数据库有着诸如:键-值、基于文档、基于列和基于图等多种类型。NoSQL比较适合那些非结构化数据具备可扩展性,以及卓越性能的场景。

近年来,随着技术的发展,虽然一些图形数据库也提供了事务在存储时需要遵循的ACID属性,但是它们仍处于早期有待改进的阶段。NoSQL的典型数据是各种数据流、文档、聊天消息、以及大数据等。它们往往来自诸如内容管理、个性化Web搜索引擎、机器学习、物联网边缘设备、以及存储了来自异构源的大型用户配置文件。

在此,我们首先对两种数据库的特征进行如下对比和总结: 

随着业务的发展和各类需求的出现,许多企业需要将现有的RDBMS数据库迁移到NoSQL,以实现业务的可扩展性和性能的动态调整。从上面的对比表格,我们可以看出,从RDBMS数据源迁移到NoSQL数据库的优势主要体现在:成本、收益、性能、可扩展性、变更、减少手动转换的工作量、以及对于分析的广泛支持等方面。

目前,Apache Cassandra和MongoDB是被使用最为广泛的NoSQL数据库。Atlas则是由MongoDB提供的DBaaS(数据库即服务)。不过,目前支持将RDBMS迁移到MongoDB或Cassandra的工具并不多。当然,我们也可以使用ETL工具或自定义的转换引擎,来实现此类复杂的迁移。

此外,由云服务提供商提供的专有数据库有:Azure Cosmos DB、AWS DynamoDB、以及Google Cloud Spanner。这些云服务提供商往往能够提供完善的架构、广泛的支持能力、文档和数据迁移工具。因此,与Cassandra或MongoDB相比,花费在建立和迁移到新的DynamoDB或Cosmos DB实例上所需的工作量会更少。当然,与Google相比,Azure和AWS NoSQL服务要更受业界的欢迎。

下面,我们来讨论如何使用云服务提供商所提供的各种工具选项,将RDBMS迁移或转换为NoSQL数据库。

1.从传统RDBMS DB到AWS DynamoDB的迁移工具

AWS Database Migration Service(AWS DMS,https://aws.amazon.com/dms)可以将数据从各种被广泛使用的商业化RDBMS、和开源的数据库,迁移到相似的同类数据库,或异构的数据库平台,以及AWS(RDS)的DBaaS平台上。

AWS Schema Conversion Tool(SCT)的对象映射功能,可以被用于在迁移的过程中,将原始数据重组为目标DynamoDB所需的数据结构。而对于复杂的转换,我们可以使用Lambda函数。当然,业界也有许多开源的工具,可以将数据库表先转换为JSON对象,然后再将这些JSON对象导入NoSQL数据库。

下面是一些具体迁移操作的实用链接:

  • 从RDBMS到DynamoDB - https://docs.aws.amazon.com/dms/latest/userguide/CHAP_Target.DynamoDB.html
  • 从Oracle到DynamoDB - https://aws.amazon.com/blogs/database/aws-database-migration-service-and-amazon-dynamodb-what-you-need-to-know/
  • 从Cassandra到DynamoDB - https://aws.amazon.com/blogs/database/migrate-apache-cassandra-databases-to-amazon-dynamodb-more-easily/
  • 从MongoDB到DynamoDB - https://aws.amazon.com/blogs/database/performing-a-live-migration-from-a-mongodb-cluster-to-amazon-dynamodb/

2.从RDBMS DB到Azure Cosmos DB的迁移工具

Azure Cosmos DB仿真器和Azure Cosmos DB Data Migration工具,可以将CSV或JSON对象等格式的源数据,从MSSQL数据库迁移到Cosmos DB中。

Azure Database Migration Service(DMS)、Cosmos DB和MongoDB的API,可被用于将MongoDB迁移到Cosmos DB。

Azure DMS、Cosmos DB、Cassandra API、以及cqlsh命令实用程序,可被用于将Cassandra迁移到Cosmos DB。

而为了从MSSQL以外的其他RDBMS中进行转换,Microsoft建议用户使用诸如Blitzz.io等第三方工具。

Azure DMS、Azure SQL Server Migration Assistant(SSMA)和Ora2Pg,也可以被用于在关系型RDBMS,与MSSQL或Azure的DBaaS平台之间,进行同质和异构的迁移。

当然,用户在使用上述工具进行迁移之前,都需要事先具有Azure的Cosmos DB订阅帐户。

下面是一些具体迁移操作的实用链接:

  • 从MS SQL到Cosmos DB - https://docs.microsoft.com/en-us/azure/cosmos-db/import-data
  • 从Oracle到Cosmos DB - https://docs.microsoft.com/en-us/azure/cosmos-db/oracle-migrate-cosmos-db-blitzz
  • 从MongoDB到Cosmos DB - https://docs.microsoft.com/en-us/azure/cosmos-db/mongodb-introduction
  • 从Cassandra到Cosmos DB - https://datamigration.microsoft.com/scenario/cassandra-to-cosmos?step=1#migrating-from-cassandra

3.从SQL迁移到Google DataStore

Google提供的NoSQL服务包括Cloud Datastore和Bigtable。其中,Cloud Datastore已被更新升级为Firestore的服务。

针对从RDBMS数据库或其他NoSQL平台,迁移到Firestore或Bigtable,Google并没有太多现成的工具和文档支持。我们只能依靠由Google托管的RDBMS Cloud SQL的内置功能,将各种传统的RDBMS迁移到Cloud SQL。而前文提到的另一个托管式RDBMS--Cloud Spanner,则需要通过手动操作来实现迁移。

有关Google的迁移操作,请参考链接--https://cloud.google.com/solutions/database-migration/technical-resources/

小结

如今,除了直接从SQL数据迁移到NoSQL数据库,许多组织也正在将传统的大型数据存储,迁移到由文件存储、NoSQL数据库和SQL数据库组成的数据湖模式中,进而方便开展存储挖掘和大数据分析。

综上所述,关系型数据库和NoSQL数据库分别适用于不同类型的作业和存储需求。在进行数据库的设计时,架构师必须考虑成本因素、高可用性(HA)设计、灾难恢复(DR)机制、以及数据存储和检索的复杂性。如果您想进一步了解此方面的知识,请参阅如下两个链接:

  • NoSQL与关系型数据库,该何时用、怎么用? - https://dzone.com/articles/nosql-vs-relational-databases-when-to-use-what
  • 数据库迁移的挑战 - https://dzone.com/articles/database-migration-challenges

原文标题:SQL vs NoSQL and SQL to NoSQL Migration,作者:Sandeep Tol

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

 

责任编辑:华轩 来源: 51CTO
相关推荐

2011-04-06 17:30:41

SQL ServerSQL

2020-01-13 15:22:42

ERP云平台迁移

2017-10-16 00:17:56

云计算信息管理迁移

2023-08-23 09:00:00

区块链以太坊

2020-06-08 10:41:13

云计算数据工具

2021-07-13 09:45:48

CentOSAlmaLinux命令

2012-08-24 09:07:25

IBMdW

2012-10-29 09:27:16

2015-03-20 13:40:17

2022-11-02 15:25:03

云数据库云平台

2020-12-08 10:01:48

DropboxNginxEnvoy

2011-09-07 09:30:57

服务器虚拟机

2011-07-28 18:08:51

SQL Server MySQL

2021-10-28 08:00:00

数据库SQL技术

2012-06-20 11:17:02

MemSQL

2010-08-12 09:43:31

CassandraMongoDB

2022-08-29 14:14:22

云计算云迁移数据分析

2016-12-12 19:16:43

数据云端

2024-03-28 09:00:00

NoSQL数据库

2011-07-28 15:53:06

SQL Server数合并查询
点赞
收藏

51CTO技术栈公众号