SQL Server 2008 CDC功能的主要作用是什么?

数据库 SQL Server
我们今天主要是和大家一起分享的是SQL Server 2008 CDC功能,以及对SQL Server 2008 CDC功能的主要作用的描述。

以下的文章主要向大家描述的是SQL Server 2008 CDC功能,我们大家都知道SQL Server 2008 CDC(Change Data Capture)其主要是通过对事务日志的异步读取,记录DML操作的发生时间、类型和实际影响的数据变化,然后将这些数据记录到启用CDC时自动创建的表中。

通过SQL Server 2008 CDC相关的存储过程,可以获取详细的数据变化情况。由于数据变化是异步读取的,因此对整体性能的影响不大,远小于通过Trigger实现的数据变化记录。

下面我用一个实例讲解这个功能。该功能主要在ETL解决方案中比较有用。

  1. USE AdventureWorksDW;  
  2. GO  
  3. EXECUTE sys.sp_cdc_enable_db; --启用数据库对CDC的支持  
  4. GO   
  5. EXEC sys.sp_cdc_enable_table 'dbo',   
  6. 'FactInternetSales', @role_name = NULL, @supports_net_changes =0; --启用某个表对CDC的支持  
  7. GO  

这里的supports_net_changes指的是是否支持所谓的净更改,即过滤掉重复的

  1. SELECT name, is_tracked_by_cdc FROM sys.tables   
  2. WHERE name LIKE ('fact%');   
  3. INSERT INTO FactInternetSales  
  4. VALUES(484,1127,1139,1134,18759,1,100,6,'SO75124',1,1,1,21.9800,21.9800,0,0,8.2205,8.2205,21.9800,1.7584,0.5495,NULL,NULL);   
  5. INSERT INTO FactInternetSales   
  6. VALUES(486,1127,1139,1134,18759,1,100,6,'SO75125',1,1,1,21.9800,21.9800,0,0,8.2205,8.2205,21.9800,1.7584,0.5495,NULL,NULL);   
  7. UPDATE FactInternetSales   
  8. SET PromotionKey = 2  
  9. WHERE SalesOrderNumber = 'SO75124';   
  10. DELETE FROM FactInternetSales WHERE SalesOrderNumber='SO75125'   
  11. SELECT * FROM cdc.dbo_FactInternetSales_CT; 

这个表其实是在系统表里面

 

这里将看到4条结果,其中operation为3和4是update操作的那条,3表示旧值,4表示新值

2表示新增

1表示删除

  1. DECLARE @begin_time datetime, @end_time datetime, @from_lsn binary(10), @to_lsn binary(10);  
  2. -- Obtain the beginning of the time interval.  
  3. SET @begin_time = GETDATE()-1;   
  4. SET @end_time = GETDATE();  
  5. -- Map the time interval to a change data capture query range.  
  6. SELECT @from_lsn = sys.fn_cdc_map_time_to_lsn('smallest greater than or equal', @begin_time);  
  7. SELECT @to_lsn = sys.fn_cdc_map_time_to_lsn('largest less than or equal', @end_time);  
  8. print @begin_time  
  9. print @end_time  
  10. print @from_lsn  
  11. print @to_lsn  

创建一个存储过程,根据开始时间和结束时间读取变更记录

 

  1. CREATE PROC GetCDCResult  
  2. (@begin_time DATETIME,@end_time DATETIME)  
  3. AS  
  4. DECLARE @from_lsn binary(10), @to_lsn binary(10);  
  5. SELECT @from_lsn = sys.fn_cdc_map_time_to_lsn('smallest greater than or equal', @begin_time);  
  6. SELECT @to_lsn = sys.fn_cdc_map_time_to_lsn('largest less than or equal', @end_time);  
  7. SELECT * FROM cdc.dbo_FactInternetSales_CT WHERE __$start_lsn BETWEEN @from_lsn AND @to_lsn  

调用该存储过程

  1. EXEC GetCDCResult '2009-4-27','2009-4-29'  

撤销SQL Server 2008 CDC

 

  1. EXEC sys.sp_cdc_disable_table 'dbo',   
  2. 'FactInternetSales','All'   
  3. EXEC sys.sp_cdc_disable_db  

有朋友可能会问到:CDC到底是怎么做到的呢?

下面这篇文章很详细地讲解到了该原理

 

http://technet.microsoft.com/zh-cn/library/cc645937.aspx

我总结几个重点

 

1. 其实,它是有一个独立的进程的。它是异步地读取日志文件。如果某部分更改没有被进程读到,那么此时日志截断也是没有效果的,很显然需要这样来保证。

2. net_changes是什么意思呢?说的是针对一行记录,如果有多个更改的话,那么以***的一条为准。

3. 这个更改是不是会永远保存?不会的,它会定期清除的

捕获和清除作业都是使用默认参数创建的。将立即启动捕获作业。它连续运行,每个扫描周期最多可处理 1000 个事务,并在两个周期之间停顿 5 秒钟。清除作业在每天凌晨 2 点运行一次。它将更改表项保留三天(4320 分钟),可使用单个删除语句最多删除 5000 项。

 

 

4. 如果启用了之后,修改了表的结构,会怎么样?

为适应固定列结构更改表,在为源表启用变更数据捕获后,负责填充更改表的捕获进程将忽略未指定进行捕获的任何新列。如果删除了某个跟踪的列,则会为在后续更改项中为该列提供 Null 值。

但是,如果现有列更改了其数据类型,则会将更改传播到更改表,以确保捕获机制没有导致跟踪的列发生数据丢失。捕获进程还会将检测的跟踪表列结构的任何更改发送到 cdc.ddl_history 表。如果使用者希望得到下游应用程序中可能需要进行的调整的通知,请使用 sys.sp_cdc_get_ddl_history 存储过程。

【编辑推荐】

  1. MS SQL Server问题与其正确解答方案
  2. SQL Server数据库与指定范围行的SQL语句的写法
  3. SQL Server 数据导入的实际行为规范描述
  4. SQL Server 2000的安全策略的正确打造
  5. SQL Server DateTime数据类型的另类解读

     

     

     

    以上的相关内容就是对SQL Server 2008 CDC功能的介绍,望你能有所收获。

 

责任编辑:佚名 来源: TT安全
相关推荐

2010-06-30 15:24:49

SQL Server子

2009-07-07 16:38:36

ServletCont

2022-02-18 11:06:12

首席技术官技术人工智能

2010-04-23 16:56:26

OracleSQL调优

2011-08-30 17:06:29

SQL Server CDC

2022-11-23 11:15:22

2022-11-23 16:23:12

2024-03-12 15:33:40

2020-07-27 18:13:36

电脑主板功能

2010-07-20 09:15:03

SQL Server

2022-04-08 13:58:19

物联网车队管理企业

2020-03-11 08:15:08

物联网智慧城市互联网

2022-09-27 09:52:14

物联网边缘计算

2021-04-19 21:58:32

智能照明商业建筑

2019-12-02 08:18:51

CISO首席信息安全官网络安全

2022-09-16 10:00:34

物联网制造业

2020-02-25 10:41:14

信息安全字化转型

2010-07-19 12:47:04

SQL Server

2010-07-13 12:26:49

SQL Server

2021-08-09 08:53:46

人工智能机器学习AI
点赞
收藏

51CTO技术栈公众号