死锁,其实是一个很有意思也很有挑战的技术问题,大概每个 DBA 和部分开发同学都会在工作过程中遇见 。关于死锁我会持续写一个系列的案例分析,希望能够对想了解死锁的朋友有所帮助。

2.1 环境说明

MySQL 5.6 事务隔离级别为 RR。

CREATE TABLE `ty` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`a` int(11) DEFAULT NULL,

`b` int(11) DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `idxa` (`a`)

) ENGINE=InnoDB AUTO_INCREMENT=8 DEFAULT CHARSET=utf8mb4

insert into ty(a,b) values(2,3),(5,4),(6,7);

------------------------

LATEST DETECTED DEADLOCK

------------------------

2017-09-09 22:34:13 7f78eab82700

*** (1) TRANSACTION:

TRANSACTION 9, ACTIVE 33 sec starting index read

mysql tables in use 1, locked 1

LOCK WAIT 2 lock struct(s), heap size 360, 1 row lock(s)

MySQL thread id , OS thread handle 0x7f896cc4b700, query id 780039657 localhost root updating

delete from ty where a=5

*** (1) WAITING FOR THIS LOCK TO BE GRANTED:

RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 9 lock_mode X waiting

*** (2) TRANSACTION:

TRANSACTION 8, ACTIVE 61 sec inserting, thread declared inside InnoDB 5000

mysql tables in use 1, locked 1

5 lock struct(s), heap size 1184, 4 row lock(s), undo log entries 2

MySQL thread id , OS thread handle 0x7f78eab82700, query id 780039714 localhost root update

insert into ty(a,b) values(2,10)

*** (2) HOLDS THE LOCK(S):

RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 8 lock_mode X

*** (2) WAITING FOR THIS LOCK TO BE GRANTED:

RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 8 lock_mode X locks gap before rec insert intention waiting

*** WE ROLL BACK TRANSACTION (1)

首先要理解的是 对同一个字段申请加锁是需要排队。

其次表 ty 中索引 idxa 为非唯一普通索引,我们根据事务执行的时间顺序来解释,这样比较好理解。

a. 根据死锁日志显示事务 2 也即 sess1 执行的事务,根据 HOLDS THE LOCK(S) 显示 sess1 先执行 delete from ty where a=5 ,该事务持有索引 a=5 的行锁 lock_mode X ,因为是 RR 隔离级别,所以 sess1 还持有两个 gap 锁[1,2]-[2,5], [2,5]-[3,6] 。

b. 事务1的日志也即 sess2 执行的事务,申请对 a=5 加锁,一个 rec lock 和两个 gap 锁,因为 sess1 中 delete 还没释放,故 sess2 的事务 1 等待 sess1 的事务 2 释放 a=5的锁资源。

c. 然后根据 WAITING FOR THIS LOCK TO BE GRANTED,提示事务 2 insert 语句正在等待 lock_mode X locks gap before rec insert intention waiting,因为 insert 语句 [4,2] 介于 gap 锁[1,2]-[2,5]之间,所以有了提示 "lock_mode X locks gap",insert 语句必须等待前面 sess2 中 delete 获取锁并且释放锁。于是,sess2(delete) 等待sess1(delete) ,sess1(insert)等待 sess2(delete),循环等待,造成死锁。

问题:如果 sess1 执行 insert into ty(a,b) values(5,10); sess2会遇到死锁吗?

MySQL 5.6 事务隔离级别为 RR。

CREATE TABLE `ty` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`a` int(11) DEFAULT NULL,

`b` int(11) DEFAULT NULL,

PRIMARY KEY (`id`),

unique KEY `idxa` (`a`)

) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4;

insert into t2(a,b) values(2,3),(5,4),(6,7)

------------------------

LATEST DETECTED DEADLOCK

------------------------

*** (1) TRANSACTION:

TRANSACTION 5, ACTIVE 9 sec starting index read

mysql tables in use 1, locked 1

LOCK WAIT 2 lock struct(s), heap size 360, 1 row lock(s)

MySQL thread id , OS thread handle 0x7f896cc4b700, query id 780047877 localhost root updating

delete from t2 where a=5

*** (1) WAITING FOR THIS LOCK TO BE GRANTED:

RECORD LOCKS space id 221 page no 4 n bits 72 index `idxa` of table `test`.`t2` trx id 5 lock_mode X waiting

*** (2) TRANSACTION:

TRANSACTION 4, ACTIVE 17 sec inserting, thread declared inside InnoDB 5000

mysql tables in use 1, locked 1

4 lock struct(s), heap size 1184, 3 row lock(s), undo log entries 2

MySQL thread id , OS thread handle 0x7f78ea936700, query id 780047890 localhost root update

insert t2(a,b) values(5,10)

*** (2) HOLDS THE LOCK(S):

RECORD LOCKS space id 221 page no 4 n bits 72 index `idxa` of table `test`.`t2` trx id 4 lock_mode X locks rec but not gap

*** (2) WAITING FOR THIS LOCK TO BE GRANTED:

RECORD LOCKS space id 221 page no 4 n bits 72 index `idxa` of table `test`.`t2` trx id 4 lock mode S waiting

*** WE ROLL BACK TRANSACTION (1)

首先我们要特别说明 delete 的加锁逻辑

a. 找到满足条件的记录,并且记录有效,则对记录加X锁,No Gap 锁(lock_mode X locks rec but not gap);

c. 未找到满足条件的记录,则对第一个不满足条件的记录加 Gap 锁,保证没有满足条件的记录插入(locks gap before rec)

其次需要大家注意的是对比两个死锁案例会发现,sess1 事务持有的锁类型发生了变化 delete 持有的锁变为 lock_mode X locks rec but not gap 。 insert 语句持有的锁变为 lock mode S waiting。原因是因为测试表结构发生了变化字段 a 由普通索引变为唯一键,RR 模式下对唯一键操作是没有 gap 锁的,而且 insert 写入含有唯一键的数据是会申请 GAP 锁的特殊情况 Insert Intention Lock。

本例我们依然根据事务执行的时间顺序来解释,这样比较好理解。

a. 根据死锁日志显示事务 2 也即 sess1 执行的事务,根据 HOLDS THE LOCK(S)显示 sess1 先执行 delete from ty where a=5 ,该事务持有索引 a=5 的行锁 lock_mode X locks rec but not gap。因为本例中 a 是唯一键,故没有 gap 锁。

b. 事务 1 的日志也即 sess2 执行的事务,申请对 a=5 加锁(X Next-key Lock),一个 rec lock 但是因为 sess1 中 delete 已经执行完成,记录无效没有被删除,锁还没释放,故 sess2 的事务 1 等待 sess1 的事务 2 释放 a=5 的锁资源,日志中提示  lock_mode X waiting。

c. 然后根据  WAITING FOR THIS LOCK TO BE GRANTED,提示事务 2 insert 语句正在等待 lock mode S waiting,为什么这次是 S 锁呢?因为 a 字段是一个唯一索引,所以 insert 语句会在插入前进行一次 duplicate key 的检查,需要申请 S 锁防止其他事务对 a 字段进行重复插入。而插入意向锁与 T1 已经 insert 语句必须等待前面  sess2 中 delete 获取 a=5 的行锁并且释放锁。

于是,sess2(delete) 等待sess1(delete) ,sess1(insert)等待sess2(delete),循环等待,造成死锁。

本文研究了 RR 事务隔离级别下,普通索引与唯一键两种情况的死锁场景。如何避免解决此类死锁?推荐使用 RC 隔离级别+ ROW BASE BINLOG . 但是对于 RC/RR 模式下 ,insert 遇到唯一键冲突的时候的死锁不可避免。需要开发在设计表结构的时候 减少 unique 索引设计。

扩展阅读

有赞技术团队

为 300 万商家,150 个行业,200 亿电商交易额

提供技术支持

技术博客:tech.youzan.com