你可能听说过雪花算法

开发 前端
雪花算法是一种简单高效的分布式唯一ID生成算法,但在特定情况下可能会存在一些问题,需要根据具体的应用场景来选择合适的ID生成算法。

雪花算法介绍

雪花算法(Snowflake)是一种分布式唯一ID生成算法,用于生成全局唯一的ID。它的设计目标是在分布式系统中生成ID,保证ID的唯一性、有序性和趋势递增。雪花算法的核心思想是将一个64位的ID分成多个部分,分别表示不同的信息。

雪花算法的优点是生成的ID具有趋势递增的特性,可以保证在分布式系统中生成的ID的有序性。同时,由于使用了时间戳,可以根据ID的时间戳信息进行排序和查询。

使用雪花算法生成的ID通常是一个64位的整数,可以根据需要进行转换和展示。在Java等编程语言中,可以使用相应的库或工具来生成雪花算法的ID。

雪花算法组成

  1. 时间戳(Timestamp):使用41位来表示,精确到毫秒级别。可以使用一个起始时间,然后每个毫秒自增生成唯一的时间戳。
  2. 机器ID(Machine ID):使用10位来表示,可以根据需要分配给不同的机器或节点。这样可以保证每个节点生成的ID都是唯一的。
  3. 序列号(Sequence Number):使用12位来表示,每个节点每毫秒可以生成4096个不同的序列号。当同一毫秒内生成的序列号超过4096时,会等待下一毫秒再继续生成。

通过将时间戳、机器ID和序列号组合在一起,就可以生成一个全局唯一的ID。这种算法可以在分布式系统中生成唯一的ID,保证了高并发环境下的唯一性和有序性。

雪花算法实现

雪花算法(Snowflake)是一种分布式唯一ID生成算法,它可以在分布式系统中生成全局唯一的ID。Snowflake算法的核心思想是将一个64位的ID分成多个部分,每个部分表示不同的信息。

Snowflake算法的ID结构如下:

0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000

其中,第一部分是1位的标识位,表示正负数,一般为0。接下来的41位是时间戳,表示生成ID的时间戳(毫秒级),可以使用当前时间减去一个固定的起始时间戳。然后是10位的工作机器ID,表示机器的唯一标识,可以根据机器的IP地址或其他方式生成。最后是12位的序列号,表示同一毫秒内生成的多个ID的序号。

Snowflake算法Java实现:

public class SnowflakeIdGenerator {
    // 起始的时间戳
    private final static long START_TIMESTAMP = 1609459200000L; // 2021-01-01 00:00:00

    // 每部分占用的位数
    private final static long SEQUENCE_BIT = 12; // 序列号占用的位数
    private final static long WORKER_BIT = 10; // 工作机器ID占用的位数
    private final static long TIMESTAMP_BIT = 41; // 时间戳占用的位数

    // 每部分的最大值
    private final static long MAX_SEQUENCE = ~(-1L << SEQUENCE_BIT);
    private final static long MAX_WORKER_ID = ~(-1L << WORKER_BIT);

    // 每部分向左的位移
    private final static long WORKER_LEFT = SEQUENCE_BIT;
    private final static long TIMESTAMP_LEFT = SEQUENCE_BIT + WORKER_BIT;

    private long workerId; // 工作机器ID
    private long sequence = 0L; // 序列号
    private long lastTimestamp = -1L; // 上次生成ID的时间戳

    public SnowflakeIdGenerator(long workerId) {
        if (workerId > MAX_WORKER_ID || workerId < 0) {
            throw new IllegalArgumentException("Worker ID can't be greater than " + MAX_WORKER_ID + " or less than 0");
        }
        this.workerId = workerId;
    }

    public synchronized long nextId() {
        long timestamp = System.currentTimeMillis();

        if (timestamp < lastTimestamp) {
            throw new RuntimeException("Clock moved backwards. Refusing to generate ID");
        }

        if (timestamp == lastTimestamp) {
            sequence = (sequence + 1) & MAX_SEQUENCE;
            if (sequence == 0) {
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }

        lastTimestamp = timestamp;

        return ((timestamp - START_TIMESTAMP) << TIMESTAMP_LEFT)
                | (workerId << WORKER_LEFT)
                | sequence;
    }

    private long tilNextMillis(long lastTimestamp) {
        long timestamp = System.currentTimeMillis();
        while (timestamp <= lastTimestamp) {
            timestamp = System.currentTimeMillis();
        }
        return timestamp;
    }
}

使用SnowflakeIdGenerator类生成唯一的ID,示例代码如下:

public class Main {
    public static void main(String[] args) {
        SnowflakeIdGenerator idGenerator = new SnowflakeIdGenerator(1);
        long id = idGenerator.nextId();
        System.out.println("Generated ID: " + id);
    }
}

雪花算法优缺点

「优点」

  1. 唯一性:雪花算法可以生成全局唯一的ID,每个ID都是独一无二的,不会重复。
  2. 高性能:雪花算法生成ID的速度非常快,可以在短时间内生成大量的ID。
  3. 可排序:雪花算法生成的ID是按照时间顺序递增的,可以根据ID的大小来判断生成的时间先后顺序。
  4. 分布式:雪花算法可以在分布式系统中使用,不同的节点可以独立生成ID,不会产生冲突。

「缺点」

  1. 依赖系统时钟:雪花算法的唯一性依赖于系统时钟的准确性,如果系统时钟发生回拨或者不同步,可能会导致生成的ID重复。
  2. 时钟回拨问题:如果系统时钟发生回拨,可能会导致生成的ID比之前生成的ID小,这会破坏ID的递增顺序。
  3. 时钟同步问题:在分布式系统中,不同节点的系统时钟可能存在不同步的情况,这可能会导致生成的ID不是全局唯一的。
  4. 有限的并发性:雪花算法中的每个部分(时间戳、机器ID、序列号)都有一定的位数限制,这限制了并发生成ID的数量。

雪花算法是一种简单高效的分布式唯一ID生成算法,但在特定情况下可能会存在一些问题,需要根据具体的应用场景来选择合适的ID生成算法。

责任编辑:武晓燕 来源: 沐雨花飞蝶
相关推荐

2024-03-11 00:02:00

tr命令文本处理命令字符

2022-05-09 08:40:14

Python技巧代码

2020-11-16 12:09:25

Python开发工具

2016-01-27 10:26:53

JavaScript操作系统

2016-07-11 00:40:30

2012-02-01 10:18:23

编程

2022-03-21 11:50:58

医疗物联网物联网

2018-10-11 10:41:12

Go 开发技术

2018-09-28 07:00:03

编程语言Go语言

2016-01-26 15:33:07

JavaScriptNodeOS操作系统

2014-12-02 10:12:02

BaaSFacebook云服务

2021-06-07 09:55:58

JavaScript开发 技巧

2021-07-28 08:00:00

Linux操作系统工具

2022-11-30 16:31:48

CSS开发浏览器

2020-09-29 06:39:38

智能

2020-07-20 07:16:47

Python编程语言工具

2021-01-20 15:20:02

JS操作符前端

2022-09-29 08:39:37

架构

2020-10-09 07:54:43

PythonJava爬虫

2023-07-13 09:16:47

循环队列指针front​
点赞
收藏

51CTO技术栈公众号