社区编辑申请
注册/登录
聊聊Ntp导致的时钟回拨
运维 服务器运维
时钟回拨的情况也会影响到采用雪花算法这种对时间戳要求单调的算法。很明显的,时间戳回调后,极易形成重复的序列号。

时钟回拨

我们的服务器时间校准一般是通过ntp进程去校准的。但由于校准这个动作,会导致时钟跳跃变化的现象。而这种情况里面,往往回拨最能引起我们的困扰,回拨如下所示:

会引起什么问题

准点调度任务的误判

假设有一个任务每天0点时候获取昨天所有的数据进行对账,正常情况和时钟回拨的情况如下图所示:

针对这种情况,笔者让业务调整了调度触发时间,不要精确在准点,以避免此问题。

唯一序列号(雪花算法)

时钟回拨的情况也会影响到采用雪花算法这种对时间戳要求单调的算法。很明显的,时间戳回调后,极易形成重复的序列号。

对于这种情况我们采用预留序列号段,在检测到这种情况后,将预留序列号分配出去,进而解决这一问题。

ntpd的时钟回拨(跳变)条件

事实上,ntpd本身还有另一种方案,即通过调整滴答频率来让我们的本地时钟慢慢的和精确时间match。但是,如果本机时间和精确时间(从ntpd服务器获取的时间)相差过大(> stepout threshold 128ms),则ntpd会直接采用跳跃变化的方式修正时间。代码如下所示:

  1. ntp_loopfilter.c 
  2.  
  3. double  clock_max = CLOCK_MAX; // .128也就是128ms 
  4.  
  5. int local_lock(...) { 
  6.     // 差距>128ms之后,选择跳变 
  7.     if (fabs(fp_offset) > clock_max && clock_max > 0) { 
  8.         ...... 
  9.         // 修正simclock.local_time 
  10.         step_systime(fp_offset); 
  11.         ...... 
  12.     } 

而在我们的线上,在/var/log/message中经常能见到时钟跳变的输出。

-x选项

我们采用-x选项,可以将stepout threshold(128ms)提升到600s。这样,不是太极端的情况,应该都不会触发到时钟回拨。但这会导致长时间时间戳不准确的问题(毕竟,调整滴答频率来慢慢match比较慢)。

stepback stepback

在高版本的ntpd中,还可以有stepback选项,如果设置为0的话,则不会回拨。

本文转载自微信公众号「解Bug之路」,作者解Bug之路。转载本文请联系解Bug之路公众号。

 

责任编辑:武晓燕 来源: 解Bug之路
相关推荐

2022-06-10 17:37:37

数据库

2022-05-23 11:03:53

云原生技术DockerIstio

2022-06-13 07:36:06

2022-06-08 13:48:06

物联网卡智能设备SIM卡

2022-05-24 08:21:16

数据安全API

2022-06-17 09:21:53

Pandas代码透视表

2022-05-16 07:35:21

Windows远程桌面远程服务器

2022-06-01 09:51:51

Golang方法接收者

2022-05-31 06:01:00

WDM/OTN网络数据

2022-05-31 07:55:23

智能运维模型

2022-04-01 08:27:30

告警收敛运维监控

2022-06-16 14:17:54

网络网速

2022-01-27 08:53:31

2022-04-12 09:05:30

Linux时钟

2022-06-09 14:28:49

深度学习AI

2022-04-29 10:27:58

数据库删库MySQL

2022-04-02 10:23:12

MySQL数据库

2022-03-11 20:46:01

机制命令kerberos

2022-03-04 08:10:35

NettyIO模型Reactor

2022-02-08 23:59:12

编辑推荐

运维工作到底是做什么的?给1到10年运维人的修仙指南Windows下的几种提权方式的粗略汇总推荐 | 10款优秀的SQL Server服务器监控工具9款优秀网络,服务器和应用程序监控工具
我收藏的内容
点赞
收藏

51CTO技术栈公众号