面试热点Redis分布式锁,再细说一次
扫描二维码
随时随地手机看文章
- setnx
- redLock
- redisson
| setnx
其实目前通常所说的setnx命令,并非单指redis的setnx key value这条命令。一般代指redis中对set命令加上nx参数进行使用, set这个命令,目前已经支持这么多参数可选:SET key value [EX seconds|PX milliseconds] [NX|XX] [KEEPTTL]当然了,就不在文章中默写Api了,基础参数还有不清晰的,可以蹦到官网。



以此类推,进程C可能释放进程D的锁,进程D....(禁止套娃),具体什么后果就不得而知了。所以在用setnx的时候,key虽然是主要作用,但是value也不能闲着,可以设置一个唯一的客户端ID,或者用UUID这种随机数。当解锁的时候,先获取value判断是否是当前进程加的锁,再去删除。伪代码:
1String uuid = xxxx;
2// 伪代码,具体实现看项目中用的连接工具
3// 有的提供的方法名为set 有的叫setIfAbsent
4set Test uuid NX PX 3000
5try{
6// biz handle....
7} finally {
8 // unlock
9 if(uuid.equals(redisTool.get('Test')){
10 redisTool.del('Test');
11 }
12}
这回看起来是不是稳了。
相反,这回的问题更明显了,在finally代码块中,get和del并非原子操作,还是有进程安全问题。


1-- lua删除锁:
2-- KEYS和ARGV分别是以集合方式传入的参数,对应上文的Test和uuid。
3-- 如果对应的value等于传入的uuid。
4if redis.call('get', KEYS[1]) == ARGV[1]
5 then
6 -- 执行删除操作
7 return redis.call('del', KEYS[1])
8 else
9 -- 不成功,返回0
10 return 0
11end
通过lua脚本能保证原子性的原因说的通俗一点:就算你在lua里写出花,执行也是一个命令(eval/evalsha)去执行的,一条命令没执行完,其他客户端是看不到的。那么既然这么麻烦,有没有比较好的工具呢?就要说到redisson了。介绍redisson之前,笔者简单解释一下为什么现在的setnx默认是指set命令带上nx参数,而不是直接说是setnx这个命令。因为redis版本在2.6.12之前,set是不支持nx参数的,如果想要完成一个锁,那么需要两条命令:1setnx Test uuid
2expire Test 30
即放入Key和设置有效期,是分开的两步,理论上会出现1刚执行完,程序挂掉,无法保证原子性。但是早在2013年,也就是7年前,Redis就发布了2.6.12版本,并且官网(set命令页),也早早就说明了“SETNX, SETEX, PSETEX可能在未来的版本中,会弃用并永久删除”。笔者曾阅读过一位大佬的文章,其中就有一句指导入门者的面试小套路,具体文字忘记了,大概意思如下:说到redis锁的时候,可以先从setnx讲起,最后慢慢引出set命令的可以加参数,可以体现出自己的知识面。如果有缘你也阅读过这篇文章,并且学到了这个套路,作为本文的笔者我要加一句提醒:请注意你的工作年限!首先回答官网表明即将废弃的命令,再引出set命令七年前的“新特性”,如果是刚毕业不久的人这么说,面试官会以为自己穿越了。你套路面试官,面试官也会套路你。-- vt・沃兹基硕德| redisson
Redisson是java的redis客户端之一,提供了一些api方便操作redis。但是redisson这个客户端可有点厉害,笔者在官网截了仅仅是一部分的图:
锁只是它的冰山一角,并且从它的wiki页面看到,对主从,哨兵,集群等模式都支持,当然了,单节点模式肯定是支持的。本文还是以锁为主,其他的不过多介绍。Redisson普通的锁实现源码主要是RedissonLock这个类,还没有看过它源码的盆友,不妨去瞧一瞧。源码中加锁/释放锁操作都是用lua脚本完成的,封装的非常完善,开箱即用。这里有个小细节,加锁使用setnx就能实现,也采用lua脚本是不是多此一举?笔者也非常严谨的思考了一下:这么厉害的东西哪能写废代码?


| RedLock
redLock的中文是直译过来的,就叫红锁。红锁并非是一个工具,而是redis官方提出的一种分布式锁的算法。就在刚刚介绍完的redisson中,就实现了redLock版本的锁。也就是说除了getLock方法,还有getRedLock方法。笔者大概画了一下对红锁的理解:
RedLock作者指出,之所以要用独立的,是避免了redis异步复制造成的锁丢失,比如:主节点没来的及把刚刚set进来这条数据给从节点,就挂了。有些人是不是觉得大佬们都是杠精啊,天天就想着极端情况。其实高可用嘛,拼的就是99.999...% 中小数点后面的位数。回到上面那张简陋的图片,红锁算法认为,只要(N/2) 1个节点加锁成功,那么就认为获取了锁, 解锁时将所有实例解锁。流程为:
- 顺序向五个节点请求加锁
- 根据一定的超时时间来推断是不是跳过该节点
- 三个节点加锁成功并且花费时间小于锁的有效期
- 认定加锁成功
那么加锁成功的节点总共花费了3秒,所以锁的实际有效期是小于27秒的。即扣除加锁成功三个实例的3秒,还要扣除等待超时redis实例的总共时间。看到这,你有可能对这个算法有一些疑问,那么你不是一个人。回头看看Redis官网关于红锁的描述。就在这篇描述页面的最下面,你能看到著名的关于红锁的神仙打架事件。
即Martin Kleppmann和antirez的redLock辩论. 一个是很有资历的分布式架构师,一个是redis之父。官方挂人,最为致命。开个玩笑,要是质疑能被官方挂到官网,说明肯定是有价值的。所以说如果项目里要使用红锁,除了红锁的介绍,不妨要多看两篇文章,即:
- Martin Kleppmann的质疑贴
- antirez的反击贴