SQL Server表分区的NULL值问题

数据库 SQL Server
SQL Server表分区只支持range分区这一种类型,往往会被大家吐槽 人家MySQL支持四种类型:RANGE分区、LIST分区、HASH分区、KEY分区。

  SQL Server表分区只支持range分区这一种类型,往往会被大家吐槽

  人家MySQL支持四种类型:RANGE分区、LIST分区、HASH分区、KEY分区

  共同点是MySQL跟SQL Server也有分区对齐的问题,都是水平切分,大家都允许分区列存在NULL值

  这次我们测试SQL Server表分区的分区列的NULL值,究竟NULL值是被存放在哪个区间,以前一直没有注意

  测试脚本

 

  1. --1.创建文件组 
  2. ALTER DATABASE [sss] 
  3. ADD FILEGROUP [FG_TinyBlog_Id_01] 
  4.  
  5. ALTER DATABASE [sss] 
  6. ADD FILEGROUP [FG_TinyBlog_Id_02] 
  7.  
  8. ALTER DATABASE [sss] 
  9. ADD FILEGROUP [FG_TinyBlog_Id_03] 
  10.  
  11. ALTER DATABASE [sss] 
  12. ADD FILEGROUP [FG_TinyBlog_Id_04] 
  13.  
  14. ALTER DATABASE [sss] 
  15. ADD FILEGROUP [FG_TinyBlog_Id_05] 
  16.  
  17.  
  18. --2.创建文件 
  19. ALTER DATABASE [sss] 
  20. ADD FILE 
  21. (NAME = N'FG_TinyBlog_Id_01_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_01_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) 
  22. TO FILEGROUP [FG_TinyBlog_Id_01]; 
  23.  
  24. ALTER DATABASE [sss] 
  25. ADD FILE 
  26. (NAME = N'FG_TinyBlog_Id_02_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_02_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) 
  27. TO FILEGROUP [FG_TinyBlog_Id_02]; 
  28.  
  29. ALTER DATABASE [sss] 
  30. ADD FILE 
  31. (NAME = N'FG_TinyBlog_Id_03_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_03_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) 
  32. TO FILEGROUP [FG_TinyBlog_Id_03]; 
  33.  
  34. ALTER DATABASE [sss] 
  35. ADD FILE 
  36. (NAME = N'FG_TinyBlog_Id_04_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_04_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) 
  37. TO FILEGROUP [FG_TinyBlog_Id_04]; 
  38.  
  39. ALTER DATABASE [sss] 
  40. ADD FILE 
  41. (NAME = N'FG_TinyBlog_Id_05_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_05_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) 
  42. TO FILEGROUP [FG_TinyBlog_Id_05]; 
  43.  
  44.  
  45. --3.创建分区函数 
  46. CREATE PARTITION FUNCTION 
  47. Fun_TinyBlog_Id(INTAS 
  48. RANGE LEFT 
  49. FOR VALUES(-10,0,1,6) 
  50.  
  51.  
  52. --4.创建分区方案 
  53. CREATE PARTITION SCHEME 
  54. [Sch_TinyBlog_Id] AS 
  55. PARTITION [Fun_TinyBlog_Id] 
  56. TO([FG_TinyBlog_Id_01],[FG_TinyBlog_Id_02],[FG_TinyBlog_Id_03],[FG_TinyBlog_Id_04],[FG_TinyBlog_Id_05]) 

 

  插入测试数据

 

  1. USE [sss] 
  2.  
  3.  
  4.  
  5. CREATE TABLE TinyBlog(id INT  NULL,NAME VARCHAR(100))  
  6.  ON [Sch_TinyBlog_Id](id) 
  7.  
  8.  
  9.  
  10.  
  11. SELECT * FROM TinyBlog ORDER BY id  
  12.  
  13.  
  14. INSERT INTO [dbo].[TinyBlog] 
  15.         ( [id], [NAME] ) 
  16. VALUES  ( NULL-- id - int 
  17.           '3232'  -- NAME - varchar(100) 
  18.           ) 
  19.  
  20. INSERT INTO [dbo].[TinyBlog] 
  21.         ( [id], [NAME] ) 
  22. VALUES  ( -2, -- id - int 
  23.           '-2'  -- NAME - varchar(100) 
  24.           ) 
  25.  
  26.  
  27. INSERT INTO [dbo].[TinyBlog] 
  28.         ( [id], [NAME] ) 
  29. VALUES  ( 66, -- id - int 
  30.           '66'  -- NAME - varchar(100) 
  31.           ) 
  32.  
  33. INSERT INTO [dbo].[TinyBlog] 
  34.         ( [id], [NAME] ) 
  35. VALUES  ( 0, -- id - int 
  36.           '0'  -- NAME - varchar(100) 
  37.           ) 
  38.  
  39. INSERT INTO [dbo].[TinyBlog] 
  40.         ( [id], [NAME] ) 
  41. VALUES  ( -30, -- id - int 
  42.           '-30'  -- NAME - varchar(100) 
  43.           ) 

 

  表数据如下

 

  1. SELECT * FROM TinyBlog ORDER BY id  

  

 分区分布 

  1. --查看分区架构文件组分布 
  2. SELECT  CONVERT(VARCHAR(MAX), ps.nameAS partition_scheme , 
  3.         p.partition_number , 
  4.         CONVERT(VARCHAR(MAX), ds2.nameAS filegroup , 
  5.         CONVERT(VARCHAR(MAX), ISNULL(v.value, ''), 120) AS range_boundary , 
  6.         STR(p.rows, 9) AS rows 
  7. FROM    sys.indexes i 
  8.         JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id 
  9.         JOIN sys.destination_data_spaces dds ON ps.data_space_id = dds.partition_scheme_id 
  10.         JOIN sys.data_spaces ds2 ON dds.data_space_id = ds2.data_space_id 
  11.         JOIN sys.partitions p ON dds.destination_id = p.partition_number 
  12.                                  AND p.object_id = i.object_id 
  13.                                  AND p.index_id = i.index_id 
  14.         JOIN sys.partition_functions pf ON ps.function_id = pf.function_id 
  15.         LEFT JOIN sys.Partition_Range_values v ON pf.function_id = v.function_id 
  16.                                                   AND v.boundary_id = p.partition_number 
  17.                                                   - pf.boundary_value_on_right 
  18. WHERE   i.object_id = OBJECT_ID('TinyBlog'
  19.         AND i.index_id IN ( 0, 1 ) 
  20. ORDER BY p.partition_number 
  21.  
  22.  
  23. --分区区间 
  24. --SELECT  *  FROM    sys.partition_range_values 

 


 分区情况  

  1. --分区情况 
  2. SELECT  c.* , 
  3.         b.[groupname] AS '分区方案对应的文件组名称' , 
  4.         d.name '当前分区函数对应的分区方案' 
  5. FROM    sys.destination_data_spaces AS a 
  6.         INNER JOIN sysfilegroups AS b ON a.[data_space_id] = b.[groupid] 
  7.         INNER JOIN ( SELECT $PARTITION.Fun_TinyBlog_Id(id) AS 分区编号 , 
  8.                             MIN(id) AS Min_value , 
  9.                             MAX(id) AS Max_value , 
  10.                             COUNT(id) AS 记录数 
  11.                      FROM   [dbo].[TinyBlog] 
  12.                      GROUP BY $PARTITION.Fun_TinyBlog_Id(id) 
  13.                    ) AS c ON c.[分区编号] = a.[destination_id] 
  14.         INNER JOIN sys.partition_schemes AS d ON a.[partition_scheme_id] = d.data_space_id 
  15. ORDER BY c.[分区编号] 

  

 

  第二个视图直接把NULL值忽略了

  根据***个视图,我们画出一个总结图

  

 

  分析一下

  

 

  总结

  结论其实很清晰,分区列不要允许NULL,如果允许列,那么我们交换分区归档数据的时候就会有麻烦了,因为无法判断分区列是NULL值的那些数据行是老数据还是新数据。

责任编辑:honglu 来源: 博客园
相关推荐

2010-11-10 14:47:11

SQL Server创

2021-01-18 05:23:14

SQL 排序Server

2010-07-19 11:01:55

SQL Server

2010-09-28 11:48:36

SQL NULL值

2011-04-13 14:20:52

SQL Server主键

2011-07-20 16:03:06

SQL Server数分区表

2010-09-10 13:37:30

表分区SQL Server

2010-09-13 11:09:34

SQL SERVER分

2010-09-16 14:38:55

Sql server表

2010-09-16 15:25:46

SqlServer20

2010-09-16 16:06:01

sql server表

2010-10-19 16:40:34

sql server挂

2010-11-10 14:35:17

SQL Server创

2010-07-13 12:26:49

SQL Server

2010-07-23 14:11:18

SQL Server

2010-07-22 16:02:29

2011-05-19 14:40:33

SQL Server

2022-09-13 08:33:05

SQLNULL三值逻辑

2011-04-18 10:13:15

SQL Server 自动化表分区

2010-07-26 14:09:32

SQL Server
点赞
收藏

51CTO技术栈公众号