This repository was archived by the owner on Apr 15, 2026. It is now read-only.

Tinyid原理介绍

duimba edited this page Mar 11, 2019 · 4 revisions

Id生成系统要点

在简单系统中,我们常常使用db的id自增方式来标识和保存数据,随着系统的复杂,数据的增多,分库分表成为了常见的方案,db自增已无法满足要求。这时候全局唯一的id生成系统就派上了用场。当然这只是id生成其中的一种应用场景。那么id生成系统有哪些要求呢?

全局唯一的id:无论怎样都不能重复,这是最基本的要求了
高性能:基础服务尽可能耗时少,如果能够本地生成最好
高可用:虽说很难实现100%的可用性,但是也要无限接近于100%的可用性
简单易用: 能够拿来即用,接入方便,同时在系统设计和实现上要尽可能的简单

Tinyid的实现原理

我们先来看一下最常见的id生成方式,db的auto_increment,相信大家都非常熟悉,我也见过一些同学在实战中使用这种方案来获取一个id,这个方案的优点是简单,缺点是每次只能向db获取一个id,性能比较差,对db访问比较频繁,db的压力会比较大。那么是不是可以对这种方案优化一下呢,可否一次向db获取一批id呢?答案当然是可以的。
一批id,我们可以看成是一个id范围,例如(1000,2000],这个1000到2000也可以称为一个"号段",我们一次向db申请一个号段,加载到内存中,然后采用自增的方式来生成id,这个号段用完后,再次向db申请一个新的号段,这样对db的压力就减轻了很多,同时内存中直接生成id,性能则提高了很多。那么保存db号段的表该怎设计呢?

DB号段算法描述

id	start_id	end_id
1	1000	2000

如上表,我们很容易想到的是db直接存储一个范围(start_id,end_id],当这批id使用完毕后,我们做一次update操作,update start_id=2000(end_id), end_id=3000(end_id+1000),update成功了,则说明获取到了下一个id范围。仔细想想,实际上start_id并没有起什么作用,新的号段总是(end_id,end_id+1000]。所以这里我们更改一下,db设计应该是这样的

id	biz_type	max_id	step	version
1	1000	2000	1000	0

这里我们增加了biz_type,这个代表业务类型,不同的业务的id隔离
max_id则是上面的end_id了,代表当前最大的可用id
step代表号段的长度,可以根据每个业务的qps来设置一个合理的长度
version是一个乐观锁,每次更新都加上version,能够保证并发更新的正确性

那么我们可以通过如下几个步骤来获取一个可用的号段,

A.查询当前的max_id信息:select id, biz_type, max_id, step, version from tiny_id_info where biz_type='test';
B.计算新的max_id: new_max_id = max_id + step
C.更新DB中的max_id:update tiny_id_info set max_id=#{new_max_id} , verison=version+1 where id=#{id} and max_id=#{max_id} and version=#{version}
D.如果更新成功,则可用号段获取成功,新的可用号段为(max_id, new_max_id]
E.如果更新失败,则号段可能被其他线程获取,回到步骤A,进行重试

号段生成方案的简单架构

如上我们已经完成了号段生成逻辑,那么我们的id生成服务架构可能是这样的

[画像:简单架构]

id生成系统向外提供http服务,请求经过我们的负载均衡router,到达其中一台tinyid-server,从事先加载好的号段中获取一个id,如果号段还没有加载,或者已经用完,则向db再申请一个新的可用号段,多台server之间因为号段生成算法的原子性,而保证每台server上的可用号段不重,从而使id生成不重。
可以看到如果tinyid-server如果重启了,那么号段就作废了,会浪费一部分id;同时id也不会连续;每次请求可能会打到不同的机器上,id也不是单调递增的,而是趋势递增的,不过这对于大部分业务都是可接受的。

简单架构的问题

到此一个简单的id生成系统就完成了,那么是否还存在问题呢?回想一下我们最开始的id生成系统要求,高性能、高可用、简单易用,在上面这套架构里,至少还存在以下问题:

当id用完时需要访问db加载新的号段,db更新也可能存在version冲突,此时id生成耗时明显增加
db是一个单点,虽然db可以建设主从等高可用架构,但始终是一个单点
使用http方式获取一个id,存在网络开销,性能和可用性都不太好

优化办法

双号段缓存

对于号段用完需要访问db,我们很容易想到在号段用到一定程度的时候,就去异步加载下一个号段,保证内存中始终有可用号段,则可避免性能波动。

增加多db支持

db只有一个master时,如果db不可用(down掉或者主从延迟比较大),则获取号段不可用。实际上我们可以支持多个db,比如2个db,A和B,我们获取号段可以随机从其中一台上获取。那么如果A,B都获取到了同一号段,我们怎么保证生成的id不重呢?tinyid是这么做的,让A只生成偶数id,B只生产奇数id,对应的db设计增加了两个字段,如下所示

id	biz_type	max_id	step	delta	remainder	version
1	1000	2000	1000	2	0	0

delta代表id每次的增量,remainder代表余数,例如可以将A,B都delta都设置2,remainder分别设置为0,1则,A的号段只生成偶数号段,B是奇数号段。通过delta和remainder两个字段我们可以根据使用方的需求灵活设计db个数,同时也可以为使用方提供只生产类似奇数的id序列。

增加tinyid-client

使用http获取一个id,存在网络开销,是否可以本地生成id?为此我们提供了tinyid-client,我们可以向tinyid-server发送请求来获取可用号段,之后在本地构建双号段、id生成,如此id生成则变成纯本地操作,性能大大提升,因为本地有双号段缓存,则可以容忍tinyid-server一段时间的down掉,可用性也有了比较大的提升。

tinyid最终架构

最终我们的架构可能是这样的

[画像:最终架构]

tinyid提供http和tinyid-client两种方式接入
tinyid-server内部缓存两个号段
号段基于db生成,具有原子性
db支持多个
tinyid-server内置easy-router选择db

总结

好了,到此为止,tinyid的整体架构已经介绍完了。如果你感兴趣,可以看一下tinyid的相关代码,所有code都非常简单。Have fun!

其他说明

关于号段算法实现,tinyid参考了美团leaf,并对其做了扩展,增加了多db支持和tinyid-client,从而获得了更好的性能和可用性。

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Tinyid原理介绍

Id生成系统要点

Tinyid的实现原理

DB号段算法描述

号段生成方案的简单架构

简单架构的问题

优化办法

双号段缓存

增加多db支持

增加tinyid-client

tinyid最终架构

总结

其他说明

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Clone this wiki locally