SnowFlake 雪花算法生成分布式ID

2022-03-09 00:00:00 算法 时间 生成 数据中心 位数

SnowFlake 雪花算法基本概念

SnowFlake 雪花算法是 Twitter 开源的分布式 ID 生成算法,其具有简洁、高性能、低延迟、ID 按时间趋势有序等特点。如采用 12 位序列号,则理论支持每毫秒生成 4096 个不同数字,能够满足绝大多数高并发场景下的互联网应用。SnowFlake 雪花算法能保证在 datacenterId 和 workerId 的情况下不会生成重复值。如果单位毫秒并发量 >4096,将会等到下一毫秒继续生成 ID。因此如果单台服务器并发量大于 4096/ms,是时候考虑自研算法了。

SnowFlake 的结构如下:

总共 64 个 bit 位,对应于 Java 基本数据类型的 Long 类型 1 位符号位,正数是 0,负数是 1,id 一般是正数,因此高位是 0 41 位时间戳(毫秒级),41 位时间戳不是存储当前时间的时间戳,而是存储时间戳差值(当前时间戳 - 开始时间戳)。开始时间戳一般是 Id 生成器开始投入使用的时间,可在程序中指定。

  • 41 位时间戳,可以使用 69 年,年数 = (1L << 41) / (1000L * 60 * 60 * 24 * 365) ≈ 69

  • 10 位机器位,可以部署 1024 个节点,包括 5 位 datacenterId 和 5 位 workerId

  • 12 位序列号,毫秒内计数,支持每个节点每毫秒产生 4096 个不重复 ID 序号


基于原版算法的改进

增加毫秒内初始 id 随机生成

毫秒内初始 id 随机生成可以有效避免逆向工程导致 id 的可推测性。具体开发时通过可配置参数决定是否启用单位毫秒内随机生成起始 ID。随机生成的起始 ID 可能很大,会很快到达单位毫秒内的大值,比如 4095(12 位序列号情况下),所以需要对 4095 处理,比如取模、或者和二进制位数&运算 循环使用单位毫秒内的可用数字,避免浪费。

增加 workerId、datacenterId 自动生成

为了能够简单快捷地使用 SnowFlake 算法,可以基于 mac\hostip\jvmid 等信息自动生成 workerId、datacenterId,尽大可能不重复。要完全保证 workerId、datacenterId 的性还得借助第三方工具,比如 Redis、ZooKeeper 等开源中间件。

在单个数据中心机器数远 <32 台、数据中心数远 <32 个时,使用本文介绍的方法在不同机器上生成完全相同的 workerId、datacenterId 的概率极低。

具体开发时也保留原生接口,让使用者(比如业务系统)传入自行生成的 workerId、datacenterId ,调用方可以借助 Redis、ZK 等第三方中间件自行保证机器号和数据中心号。

时钟回拨处理

运行时

若偏差在指定时间(可配置)以内,则等待 2 倍的时间差后开始生成;若两者偏差大于某个设定的时间阈值(可配置),则立即抛出异常,避免阻塞。

系统重启时

jvmId 变化,基于 mac\hostip\jvmid 生成的机器 WorkerId 变化,即使在时钟回拨时也可以尽大可能避免生成重复 id。

当然也可以借助第三方中间件实现时间回拨处理,比如算法运行时将 lastTimestamp 写入 redis,系统启动时读取 redis 存储的 lastTimestamp 值和当前时间比较。若当前时间戳 <lastTimestamp,则启动失败。

字符串位数补齐

正数的 Long 类型转换为 10 进制数范围:0~9,223,372,036,854,775,807,可见长度为多 19 位,因此 SnowFlake 算法生成的 id 位数统一设定为 19 位为宜。

一般刚开始使用时为 18 位,但时间距离起始时间超过一定值后,会变为 19 位。

消耗完 18 位所需的时间:1*10^18 / (3600 * 24 * 365 * 1000 * 2^22) ≈ 7.56 年,即时间差超过 7.56 年,就会达到 19 位。

因此我们设置初始时间 < 当前时间 - 7.56 年,保证雪花算法生成的 id 位数统一为 19 位。

接口设计

原始算法接口

使用者可以传入自行生成的 workerId、datacenterId,原汁原味的 SnowFlake。

自动生成 workerId、datacenterId 接口

简化 SnowFlake 的使用,不保证 不重复,尽大概率不重复。

业务定制接口

调整雪花算法的 bit 位,即可以根据业务对 64 个 bit 位作出调整。

有的场景下我们需要定制雪花算法,比如生成 15 位的 10 进制数字。

生成 15 位十进制数字需要 53 位二进制数,除了 41 位时间戳 + 1 位符号位之外,还有 11 位可以用,可以采用 2 + 3 + 6(datacenterId + workerId + seqId)。

15 位的场景下理论支持单位毫秒 64 笔,每秒 64000 笔不重复,从中小规模业务量来看, tps>64000 的性能瓶颈短期不大可能出现。

订单号生成

业务系统使用基于 snowflake 的 ID 生成器,比如拼接一些业务字段,比如生成订单号时传入 pid\appId\时间戳等。

算法实现

本文提供 Java 版的算法实现,欢迎评论区留言批评指正。

import org.slf4j.Logger;import org.slf4j.LoggerFactory;
import java.lang.management.ManagementFactory;import java.net.InetAddress;import java.net.NetworkInterface;import java.util.Date;import java.util.concurrent.ThreadLocalRandom;
/** * @author NiaoGe * <p> * 雪花算法生成 id,参考开源项目: * https://gitee.com/yu120/sequence * https://apidoc.gitee.com/loolly/hutool/cn/hutool/core/util/IdUtil.html * </p> */
public class IdGenerator { private static final Logger logger = LoggerFactory.getLogger(IdGenerator.class);
//工作机器 id private long workerId; //数据中心 id private long datacenterId; //序列号 private long sequence = 0L;
//基准时间,一般取系统的近时间(一旦确定不能变动) private long twepoch;
private long workerIdBits; private long datacenterIdBits; private long maxWorkerId; private long maxDatacenterId;
//毫秒内自增位数 private long sequenceBits; //位与运算保证毫秒内 Id 范围 private long sequenceMask;
//工作机器 id 需要左移的位数 private long workerIdShift; //数据中心 id 需要左移位数 private long datacenterIdShift; //时间戳需要左移位数 private long timestampLeftShift;
//上次生成 id 的时间戳,初始值为负数 private long lastTimestamp = -1L;
//true 表示毫秒内初始序列采用随机值 private boolean randomSequence; //随机初始序列计数器 private long count = 0L;
//允许时钟回拨的毫秒数 private long timeOffset;
private final ThreadLocalRandom tlr = ThreadLocalRandom.current();
/** * 无参构造器,自动生成 workerId/datacenterId */ public IdGenerator() { this(false, 10, null, 5L, 5L, 12L); }
/** * 有参构造器,调用者自行保证数据中心 ID+机器 ID 的性 * 标准 snowflake 实现 * * @param workerId 工作机器 ID * @param datacenterId 数据中心 ID */ public IdGenerator(long workerId, long datacenterId) { this(workerId, datacenterId, false, 10, null, 5L, 5L, 12L); }
/** * @param randomSequence true 表示每毫秒内起始序号使用随机值 * @param timeOffset 允许时间回拨的毫秒数 * @param epochDate 基准时间 * @param workerIdBits workerId 位数 * @param datacenterIdBits datacenterId 位数 * @param sequenceBits sequence 位数 */ public IdGenerator(boolean randomSequence, long timeOffset, Date epochDate, long workerIdBits, long datacenterIdBits, long sequenceBits) { if (null != epochDate) { this.twepoch = epochDate.getTime(); } else { // 2012/12/12 23:59:59 GMT this.twepoch = 1355327999000L; }
this.workerIdBits = workerIdBits; this.datacenterIdBits = datacenterIdBits; this.maxWorkerId = -1L ^ (-1L << workerIdBits); this.maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
this.sequenceBits = sequenceBits; this.sequenceMask = -1L ^ (-1L << sequenceBits);
this.workerIdShift = sequenceBits; this.datacenterIdShift = sequenceBits + workerIdBits; this.timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
this.datacenterId = getDatacenterId(maxDatacenterId); this.workerId = getMaxWorkerId(datacenterId, maxWorkerId); this.randomSequence = randomSequence; this.timeOffset = timeOffset; String initialInfo = String.format("worker starting. timestamp left shift %d, datacenter id bits %d, worker id bits %d, sequence bits %d, datacenterid %d, workerid %d", timestampLeftShift, datacenterIdBits, workerIdBits, sequenceBits, datacenterId, workerId); logger.info(initialInfo); }
/** * 自定义 workerId+datacenterId+其它初始配置 * 调整 workerId、datacenterId、sequence 位数定制雪花算法,控制生成的 Id 的位数 * * @param workerId 工作机器 ID * @param datacenterId 数据中心 ID * @param randomSequence true 表示每毫秒内起始序号使用随机值 * @param timeOffset 允许时间回拨的毫秒数 * @param epochDate 基准时间 * @param workerIdBits workerId 位数 * @param datacenterIdBits datacenterId 位数 * @param sequenceBits sequence 位数 */ public IdGenerator(long workerId, long datacenterId, boolean randomSequence, long timeOffset, Date epochDate, long workerIdBits, long datacenterIdBits, long sequenceBits) { this.workerIdBits = workerIdBits; this.datacenterIdBits = datacenterIdBits; this.maxWorkerId = -1L ^ (-1L << workerIdBits); this.maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
if (workerId > maxWorkerId || workerId < ) { throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0\r\n", maxWorkerId)); } if (datacenterId > maxDatacenterId || datacenterId < ) { throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0\r\n", maxDatacenterId)); }
if (null != epochDate) { this.twepoch = epochDate.getTime(); } else { // 2012/12/12 23:59:59 GMT this.twepoch = 1355327999000L; }
this.sequenceBits = sequenceBits; this.sequenceMask = -1L ^ (-1L << sequenceBits);
this.workerIdShift = sequenceBits; this.datacenterIdShift = sequenceBits + workerIdBits; this.timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
this.workerId = workerId; this.datacenterId = datacenterId; this.timeOffset = timeOffset; this.randomSequence = randomSequence;
String initialInfo = String.format("worker starting. timestamp left shift %d, datacenter id bits %d, worker id bits %d, sequence bits %d, datacenterid %d, workerid %d", timestampLeftShift, datacenterIdBits, workerIdBits, sequenceBits, datacenterId, workerId); logger.info(initialInfo); }
private static long getDatacenterId(long maxDatacenterId) { long id = 0L; try { InetAddress ip = InetAddress.getLocalHost(); NetworkInterface network = NetworkInterface.getByInetAddress(ip); if (network == null) { id = 1L; } else { byte[] mac = network.getHardwareAddress(); if (null != mac) { id = ((0x000000FF & (long) mac[mac.length - 1]) | (0x0000FF00 & (((long) mac[mac.length - 2]) << 8))) >> 6; id = id % (maxDatacenterId + 1); } } } catch (Exception e) { throw new RuntimeException("GetDatacenterId Exception", e); } return id; }
private static long getMaxWorkerId(long datacenterId, long maxWorkerId) { StringBuilder macIpPid = new StringBuilder(); macIpPid.append(datacenterId); try { String name = ManagementFactory.getRuntimeMXBean().getName(); if (name != null && !name.isEmpty()) { //GET jvmPid macIpPid.append(name.split("@")[]); } //GET hostIpAddress String hostIp = InetAddress.getLocalHost().getHostAddress(); String ipStr = hostIp.replaceAll("\\.", ""); macIpPid.append(ipStr); } catch (Exception e) { throw new RuntimeException("GetMaxWorkerId Exception", e); } //MAC + PID + IP 的 hashcode 取低 16 位 return (macIpPid.toString().hashCode() & 0xffff) % (maxWorkerId + 1); }
public synchronized long nextId() { long currentTimestamp = timeGen();
//获取当前时间戳如果小于上次时间戳,则表示时间戳获取出现异常 if (currentTimestamp < lastTimestamp) { // 校验时间偏移回拨量 long offset = lastTimestamp - currentTimestamp; if (offset > timeOffset) { throw new RuntimeException("Clock moved backwards, refusing to generate id for [" + offset + "ms]"); }
try { // 时间回退 timeOffset 毫秒内,则允许等待 2 倍的偏移量后重新获取,解决小范围的时间回拨问题 this.wait(offset << 1); } catch (Exception e) { throw new RuntimeException(e); }
currentTimestamp = timeGen(); if (currentTimestamp < lastTimestamp) { throw new RuntimeException("Clock moved backwards, refusing to generate id for [" + offset + "ms]"); } }
//如果获取的当前时间戳等于上次时间戳(即同一毫秒内),则序列号自增 if (lastTimestamp == currentTimestamp) { // randomSequence 为 true 表示随机生成允许范围内的起始序列,否则毫秒内起始值从 0L 开始自增 long tempSequence = sequence + 1; if (randomSequence) { sequence = tempSequence & sequenceMask; count = (count + 1) & sequenceMask; if (count == ) { currentTimestamp = this.tillNextMillis(lastTimestamp); } } else { sequence = tempSequence & sequenceMask; if (sequence == ) { currentTimestamp = this.tillNextMillis(lastTimestamp); } } } else { sequence = randomSequence ? tlr.nextLong(sequenceMask + 1) : 0L; count = 0L; }
lastTimestamp = currentTimestamp;
return ((currentTimestamp - twepoch) << timestampLeftShift) | (datacenterId << datacenterIdShift) | (workerId << workerIdShift) | sequence; }
private long tillNextMillis(long lastTimestamp) { long timestamp = timeGen(); while (timestamp <= lastTimestamp) { timestamp = timeGen(); } return timestamp; }
private long timeGen() { return System.currentTimeMillis(); }
/** * 测试 * @param args */ public static void main(String[] args) {// for (int i = 0; i < 10; i++) {// IdGenerator idGenerator = new IdGenerator();// new Thread(() -> {// for (int j = 0; j < 100; j++) {// System.out.println(idGenerator.nextId());// }// }).start();// }
// IdGenerator idGenerator = new IdGenerator(1, 1);// for (int j = 0; j < 2000; j++) {// System.out.println(System.currentTimeMillis() + " " + idGenerator.nextId());// }
// IdGenerator idGenerator = new IdGenerator(true, 10, null, 3L, 2L, 7L);// for (int j = 0; j < 2000; j++) {// System.out.println(System.currentTimeMillis() + " " + idGenerator.nextId());// }
IdGenerator shortIdGenerator = new IdGenerator(7, 3, true, 10, null, 3, 2, 7); for (int j = ; j < 1000; j++) { System.out.println(System.currentTimeMillis() + " " + shortIdGenerator.nextId()); } }}

订单号生成案例

import java.text.SimpleDateFormat;import java.util.Date;
/** * 使用 IdGenerator 生成订单号 */public class OrderNoGenerator {
private IdGenerator idGenerator;
/** * 无参构造器,自动生成 workerId/datacenterId */ public OrderNoGenerator() { this.idGenerator = new IdGenerator(); }
/** * 有参构造器,使用者自行保证数据中心 ID+机器 ID 的性 * * @param idGenerator */ public OrderNoGenerator(IdGenerator idGenerator) { this.idGenerator = idGenerator; }
/** * 生成订单号 * @param env 1=dev,2=sit,3=uat,4=prd * @param pid 1=产品线 1,2=产品线 2,3=产品线 3 * @param dateFormat 日期格式 * @return */ public String getOrderNo(String env, String pid, String dateFormat) { if (dateFormat == null || dateFormat.isEmpty()) { dateFormat = "yyMMddHH"; } String dateStr = new SimpleDateFormat(dateFormat).format(new Date()); return env + pid + dateStr + idGenerator.nextId(); }
/** * 测试 * * @param args */ public static void main(String[] args) { OrderNoGenerator orderNoGenerator = new OrderNoGenerator(); for (int i = ; i < 1000; i++) { System.out.println(System.currentTimeMillis() + " " + orderNoGenerator.getOrderNo("3", "1", null)); }
System.out.println("-------------------------------------------------"); //雪花算法生成 15 位 ID IdGenerator shortIdGenerator = new IdGenerator(1, 2, false, 10, null, 3L, 2L, 7L); OrderNoGenerator shortOrderNoGenerator = new OrderNoGenerator(shortIdGenerator); for (int i = ; i < 1000; i++) { System.out.println(System.currentTimeMillis() + " " + shortOrderNoGenerator.getOrderNo("3", "1", null)); } }}

欢迎评论区留言讨论

来源 https://mp.weixin.qq.com/s/x-fc80bt6OTLZFkpxWRPvQ

相关文章