MySQL 5.7原生JSON格式支持

数据库 MySQL
在MySQL与PostgreSQL的对比中,PG的JSON格式支持优势总是不断被拿来比较。其实早先MariaDB也有对非结构化的数据进行存储的方案,称为dynamic column,但是方案是通过BLOB类型的方式来存储。这样导致的问题是查询性能不高,不能有效建立索引,与一些文档数据库对比,优势并不大,故在社区的反应其实比较一般。

在MySQL与PostgreSQL的对比中,PG的JSON格式支持优势总是不断被拿来比较。其实早先MariaDB也有对非结构化的数据进行存储的方案,称为dynamic column,但是方案是通过BLOB类型的方式来存储。这样导致的问题是查询性能不高,不能有效建立索引,与一些文档数据库对比,优势并不大,故在社区的反应其实比较一般。当然,MariaDB的dynamic column功能还不仅限于非结构化数据的存储,但不在本文进行展开。

MySQL 5.7.7 labs版本开始InnoDB存储引擎已经原生支持JSON格式,该格式不是简单的BLOB类似的替换。原生的JSON格式支持有以下的优势:

  • JSON数据有效性检查:BLOB类型无法在数据库层做这样的约束性检查
  • 查询性能的提升:查询不需要遍历所有字符串才能找到数据
  • 支持索引:通过虚拟列的功能可以对JSON中的部分数据进行索引
  1. mysql> create table user ( uid int auto_increment, 
  2.     -> data json,primary key(uid))engine=innodb; 
  3. Query OK, 0 rows affected (0.01 sec) 
  4.   
  5. mysql> insert into user values (NULL
  6.     -> '{"name":"David","mail":"jiangchengyao@gmail.com","address":"Shangahai"}'); 
  7. Query OK, 1 row affected (0.00 sec) 
  8.   
  9. mysql> insert into user values (NULL,'{"name":"Amy","mail":"amy@gmail.com"}'); 
  10. Query OK, 1 row affected (0.00 sec) 

可以看到我们新建了表user,并且将列data定义为了JSON类型。这意味着我们可以对插入的数据做JSON格式检查,确保其符合JSON格式的约束,如插入一条不合法的JSON数据会报如下错误:

  1. mysql> insert into user values (NULL,"test"); 
  2. ERROR 3130 (22032): Invalid JSON text: "Invalid value" at position 2 in value (or column'test'

此外,正如前面所说的,MySQL 5.7提供了一系列函数来高效地处理JSON字符,而不是需要遍历所有字符来查找,这不得不说是对MariaDB dynamic column的巨大改进:

  1. mysql> select jsn_extract(data, '$.name'),jsn_extract(data,'$.address'from user
  2. +-----------------------------+-------------------------------+ 
  3. | jsn_extract(data, '$.name') | jsn_extract(data,'$.address') | 
  4. +-----------------------------+-------------------------------+ 
  5. "David" | "Shangahai" | 
  6. "Amy" | NULL | 
  7. +-----------------------------+-------------------------------+ 
  8. rows in set (0.00 sec) 

当然,最令人的激动的功能应该是MySQL 5.7的虚拟列功能,通过传统的B+树索引即可实现对JSON格式部分属性的快速查询。使用方法是首先创建该虚拟列,然后在该虚拟列上创建索引:

  1. mysql> ALTER TABLE user ADD user_name varchar(128) 
  2.     -> GENERATED ALWAYS AS (jsn_extract(data,'$.name')) VIRTUAL; 
  3. Query OK, 0 rows affected (0.01 sec) 
  4. Records: 0 Duplicates: 0 Warnings: 0 
  5.   
  6. mysql> select user_name from user
  7. +-----------+ 
  8. | user_name | 
  9. +-----------+ 
  10. "Amy"     | 
  11. "David"   | 
  12. +-----------+ 
  13. rows in set (0.00 sec) 
  14.   
  15. mysql> alter table user add index idx_username (user_name); 
  16. Query OK, 2 rows affected (0.01 sec) 
  17. Records: 2  Duplicates: 0  Warnings: 0 

然后可以通过添加的索引对用户名进行快速的查询,这和普通类型的列查询一样。而通过explain可以验证优化器已经选择了在虚拟列上创建的新索引:

  1. mysql> explain select * from user where user_name='"Amy"'\G 
  2. *************************** 1. row *************************** 
  3.            id: 1 
  4.   select_type: SIMPLE 
  5.         tableuser 
  6.    partitions: NULL 
  7.          type: ref 
  8. possible_keys: idx_username 
  9.           key: idx_username 
  10.       key_len: 131 
  11.           ref: const 
  12.          rows: 1 
  13.      filtered: 100.00 
  14.         Extra: NULL 
  15. 1 row in set, 1 warning (0.00 sec) 

可以发现MySQL 5.7对于JSON格式堪称完美,相信PostgreSQL阵营需要寻找新的策略来“攻击”MySQL了吧。如无意外,还是会停留在优化器这块,毕竟这块是目前MySQL必须要克服的最大问题,好在MySQL团队已经在重构优化器代码,相信更好的优化器将会在下一个版本中全面爆发。而一大堆文档数据库们已经哭晕在厕所了吧。

博文出处:http://www.cnblogs.com/zoucaitou/p/4424575.html
 

 

责任编辑:Ophira 来源: cnblogs
相关推荐

2017-01-18 09:54:38

MySQLJson ColumnGenerated C

2020-11-09 14:41:58

iOS 14.2苹果JIT

2023-11-01 07:01:35

2019-07-17 10:19:36

MySQL数据库SQL

2010-08-23 09:23:49

Windows Pho

2009-06-03 08:50:03

微软Windows 7操作系统

2022-07-07 08:30:50

类型注解原生JS

2022-04-06 08:19:13

Go语言切片

2011-05-26 13:54:04

Json

2023-11-12 11:56:28

Json格式弊端

2023-08-20 20:46:55

2024-02-26 07:39:16

2024-01-08 09:28:20

2023-09-21 10:09:10

JavaScript数组分组

2015-10-20 09:25:41

数据库mysql

2010-01-06 17:06:05

Json格式

2019-07-22 08:49:37

PythonJSON编程语言

2010-01-08 15:30:15

JSON格式举例

2009-02-27 09:41:15

Windows 7微软mov文件

2017-08-08 11:18:26

AndroidIntent原生
点赞
收藏

51CTO技术栈公众号