MySQL实战45讲
林晓斌
网名丁奇,前阿里资深技术专家
立即订阅
43178 人已学习
课程目录
已完结 48 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词 | 这一次,让我们一起来搞懂MySQL
免费
基础篇 (8讲)
01 | 基础架构:一条SQL查询语句是如何执行的?
02 | 日志系统:一条SQL更新语句是如何执行的?
03 | 事务隔离:为什么你改了我还看不见?
04 | 深入浅出索引(上)
05 | 深入浅出索引(下)
06 | 全局锁和表锁 :给表加个字段怎么有这么多阻碍?
07 | 行锁功过:怎么减少行锁对性能的影响?
08 | 事务到底是隔离的还是不隔离的?
实践篇 (37讲)
09 | 普通索引和唯一索引,应该怎么选择?
10 | MySQL为什么有时候会选错索引?
11 | 怎么给字符串字段加索引?
12 | 为什么我的MySQL会“抖”一下?
13 | 为什么表数据删掉一半,表文件大小不变?
14 | count(*)这么慢,我该怎么办?
15 | 答疑文章(一):日志和索引相关问题
16 | “order by”是怎么工作的?
17 | 如何正确地显示随机消息?
18 | 为什么这些SQL语句逻辑相同,性能却差异巨大?
19 | 为什么我只查一行的语句,也执行这么慢?
20 | 幻读是什么,幻读有什么问题?
21 | 为什么我只改一行的语句,锁这么多?
22 | MySQL有哪些“饮鸩止渴”提高性能的方法?
23 | MySQL是怎么保证数据不丢的?
24 | MySQL是怎么保证主备一致的?
25 | MySQL是怎么保证高可用的?
26 | 备库为什么会延迟好几个小时?
27 | 主库出问题了,从库怎么办?
28 | 读写分离有哪些坑?
29 | 如何判断一个数据库是不是出问题了?
30 | 答疑文章(二):用动态的观点看加锁
31 | 误删数据后除了跑路,还能怎么办?
32 | 为什么还有kill不掉的语句?
33 | 我查这么多数据,会不会把数据库内存打爆?
34 | 到底可不可以使用join?
35 | join语句怎么优化?
36 | 为什么临时表可以重名?
37 | 什么时候会使用内部临时表?
38 | 都说InnoDB好,那还要不要使用Memory引擎?
39 | 自增主键为什么不是连续的?
40 | insert语句的锁为什么这么多?
41 | 怎么最快地复制一张表?
42 | grant之后要跟着flush privileges吗?
43 | 要不要使用分区表?
44 | 答疑文章(三):说一说这些好问题
45 | 自增id用完怎么办?
特别放送 (1讲)
直播回顾 | 林晓斌:我的 MySQL 心路历程
结束语 (1讲)
结束语 | 点线网面,一起构建MySQL知识网络
MySQL实战45讲
登录|注册

03 | 事务隔离:为什么你改了我还看不见?

林晓斌 2018-11-19
提到事务,你肯定不陌生,和数据库打交道的时候,我们总是会用到事务。最经典的例子就是转账,你要给朋友小王转 100 块钱,而此时你的银行卡只有 100 块钱。
转账过程具体到程序里会有一系列的操作,比如查询余额、做加减法、更新余额等,这些操作必须保证是一体的,不然等程序查完之后,还没做减法之前,你这 100 块钱,完全可以借着这个时间差再查一次,然后再给另外一个朋友转账,如果银行这么整,不就乱了么?这时就要用到“事务”这个概念了。
简单来说,事务就是要保证一组数据库操作,要么全部成功,要么全部失败。在 MySQL 中,事务支持是在引擎层实现的。你现在知道,MySQL 是一个支持多引擎的系统,但并不是所有的引擎都支持事务。比如 MySQL 原生的 MyISAM 引擎就不支持事务,这也是 MyISAM 被 InnoDB 取代的重要原因之一。
今天的文章里,我将会以 InnoDB 为例,剖析 MySQL 在事务支持方面的特定实现,并基于原理给出相应的实践建议,希望这些案例能加深你对 MySQL 事务原理的理解。

隔离性与隔离级别

提到事务,你肯定会想到 ACID(Atomicity、Consistency、Isolation、Durability,即原子性、一致性、隔离性、持久性),今天我们就来说说其中 I,也就是“隔离性”。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《MySQL实战45讲》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(380)

  • 壹笙☞漂泊 置顶
    1、务的特性:原子性、一致性、隔离性、持久性
    2、多事务同时执行的时候,可能会出现的问题:脏读、不可重复读、幻读
    3、事务隔离级别:读未提交、读提交、可重复读、串行化
    4、不同事务隔离级别的区别:
    读未提交:一个事务还未提交,它所做的变更就可以被别的事务看到
    读提交:一个事务提交之后,它所做的变更才可以被别的事务看到
    可重复读:一个事务执行过程中看到的数据是一致的。未提交的更改对其他事务是不可见的
    串行化:对应一个记录会加读写锁,出现冲突的时候,后访问的事务必须等前一个事务执行完成才能继续执行
    5、配置方法:启动参数transaction-isolation
    6、事务隔离的实现:每条记录在更新的时候都会同时记录一条回滚操作。同一条记录在系统中可以存在多个版本,这就是数据库的多版本并发控制(MVCC)。
    7、回滚日志什么时候删除?系统会判断当没有事务需要用到这些回滚日志的时候,回滚日志会被删除。
    8、什么时候不需要了?当系统里么有比这个回滚日志更早的read-view的时候。
    9、为什么尽量不要使用长事务。长事务意味着系统里面会存在很老的事务视图,在这个事务提交之前,回滚记录都要保留,这会导致大量占用存储空间。除此之外,长事务还占用锁资源,可能会拖垮库。
    10、事务启动方式:一、显式启动事务语句,begin或者start transaction,提交commit,回滚rollback;二、set autocommit=0,该命令会把这个线程的自动提交关掉。这样只要执行一个select语句,事务就启动,并不会自动提交,直到主动执行commit或rollback或断开连接。
    11、建议使用方法一,如果考虑多一次交互问题,可以使用commit work and chain语法。在autocommit=1的情况下用begin显式启动事务,如果执行commit则提交事务。如果执行commit work and chain则提交事务并自动启动下一个事务。

    思考题:

    在开发过程中,尽可能的减小事务范围,少用长事务,如果无法避免,保证逻辑日志空间足够用,并且支持动态日志空间增长。监控Innodb_trx表,发现长事务报警。

    疑问:

    关于第二节的思考题,读题干的意思,是在什么场景下,一天一备比一周一备更有优势。老师的答案只是给出了一天一备的优势,那么适用场景怎么理解呢?

    作者回复: 总结得非常好👍🏿

    第二讲问题,其实备份是强需求,至于多少合适,还是得平衡业务需求和存储成本

    2018-11-19
    4
    211
  • 京京beaver 置顶
    mysql> show variables like 'transaction_isolation';
    这句写错了,应该是tx_isolation。测试了一下

    作者回复: 你是不是用的5.6或更早的版本😄

    5.7引入了transaction_isolation用来替换tx_isolation了,到8.0.3就去掉了后者了

    2018-12-28
    3
    26
  • 丁奇 置顶
    预告:林晓斌老师将做客极客Live,分享他MySQL的心路历程
    前阿里丁奇:我的MySQL心路历程
    11月21日(周三) 20:30-21:30

    本次直播,林晓斌将畅谈个人成长经历,分享自己是如何从数据库小白逐步成长为MySQL内核开发人员的。从业十几年,他经历了哪些比较重要的事儿?他觉得什么事儿最有难度?什么事儿最有成就感?他是怎样应对的?
    1、MySQL数据库的最佳学习路径
    2、丁奇遇到过哪些挑战?走过那些坑?是如何应对的?
    3、从业十几年来,关于数据库性能的“奇闻异事”

    加小助手微信:geektime001或geektime004(二选一),获取直播最新消息
    2018-11-19
    2
    24
  • LAMBO
    读未提交:别人改数据的事务尚未提交,我在我的事务中也能读到。
    读已提交:别人改数据的事务已经提交,我在我的事务中才能读到。
    可重复读:别人改数据的事务已经提交,我在我的事务中也不去读。
    串行:我的事务尚未提交,别人就别想改数据。
    这4种隔离级别,并行性能依次降低,安全性依次提高。

    作者回复: 总结的好👍🏿

    2018-11-20
    205
  • WL
    为该讲总结了几个问题, 大家复习的时候可以先尝试回答这些问题检查自己的掌握程度:

    1.
    事务的概念是什么?
    2.
    mysql的事务隔离级别读未提交, 读已提交, 可重复读, 串行各是什么意思?
    3.
    读已提交, 可重复读是怎么通过视图构建实现的?
    4.
    可重复读的使用场景举例? 对账的时候应该很有用?
    5.
    事务隔离是怎么通过read-view(读视图)实现的?
    6.
    并发版本控制(MCVV)的概念是什么, 是怎么实现的?
    7.
    使用长事务的弊病? 为什么使用常事务可能拖垮整个库?
    8.
    事务的启动方式有哪几种?
    9.
    commit work and chain的语法是做什么用的?
    10.
    怎么查询各个表中的长事务?
    11.
    如何避免长事务的出现?

    作者回复: 谢谢。我在微博上会截图优质评论,你的总结会经常“上榜”哈。如果有不合适你跟我说下,我去删掉🤝

    2018-11-24
    2
    102
  • Gavin
    下面是我的自问自答,也是我的学习笔记,问下斌哥,这样理解准确吗?
    在可重复读的隔离级别下,如何理解**当系统里没有比这个回滚日志更早的 read-view 的时候**,这个回滚日志就会被删除?

    这也是**尽量不要使用长事务**的主要原因。

    比如,在某个时刻(今天上午9:00)开启了一个事务A(对于可重复读隔离级别,此时一个视图read-view A也创建了),这是一个很长的事务……

    事务A在今天上午9:20的时候,查询了一个记录R1的一个字段f1的值为1……

    今天上午9:25的时候,一个事务B(随之而来的read-view B)也被开启了,它更新了R1.f1的值为2(同时也创建了一个由2到1的回滚日志),这是一个短事务,事务随后就被commit了。

    今天上午9:30的时候,一个事务C(随之而来的read-view C)也被开启了,它更新了R1.f1的值为3(同时也创建了一个由3到2的回滚日志),这是一个短事务,事务随后就被commit了。

    ……

    到了下午3:00了,长事务A还没有commit,为了保证事务在执行期间看到的数据在前后必须是一致的,那些老的事务视图、回滚日志就必须存在了,这就占用了大量的存储空间。

    源于此,我们应该尽量不要使用长事务。

    作者回复: 非常好

    2018-12-04
    7
    80
  • William
    脏读:
    当数据库中一个事务A正在修改一个数据但是还未提交或者回滚,
    另一个事务B 来读取了修改后的内容并且使用了,
        之后事务A提交了,此时就引起了脏读。
       
    此情况仅会发生在: 读未提交的的隔离级别.
       
    不可重复读:
    在一个事务A中多次操作数据,在事务操作过程中(未最终提交),
    事务B也才做了处理,并且该值发生了改变,这时候就会导致A在事务操作
    的时候,发现数据与第一次不一样了。 就是不可重复读。

    此情况仅会发生在:读未提交、读提交的隔离级别.

    幻读:
    一个事务按相同的查询条件重新读取以前检索过的数据,
    却发现其他事务插入了满足其查询条件的新数据,这种现象就称为幻读。

    幻读是指当事务不是独立执行时发生的一种现象,例如第一个事务对一个表中的数据进行了修改,比如这种修改涉及到表中的“全部数据行”。同时,第二个事务也修改这个表中的数据,这种修改是向表中插入“一行新数据”。那么,以后就会发生操作第一个事务的用户发现表中还存在没有修改的数据行,就好象发生了幻觉一样.
    一般解决幻读的方法是增加范围锁RangeS,锁定检索范围为只读,这样就避免了幻读。

    此情况会回发生在:读未提交、读提交、可重复读的隔离级别.


    事务的隔离级别:
    四种:读未提交 、 读提交 、 可重复读、 串行化。
    2018-12-13
    1
    52
  • 滩涂曳尾
    在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的。老师,这句话怎么理解呢
    2018-11-20
    3
    48
  • 果然如此
    作业:设置autocommit=1,另外,编写一个定时监控Innodb_trx表中时间比较大的事务的任务,如果发现长事务,随时自动发邮件提醒开发人员。
    2018-11-19
    37
  • lfn
    事务隔离的实现似乎有点太简略,没跟上林老师的思路。。

    作者回复: 对于RR,你可以这么想,每个事务启动的时候打一个快照,别人改的“我不听我不听”😄

    2018-11-19
    1
    29
  • 能抽出一章详细的讲讲mvcc吗,感觉很模糊
    2018-11-21
    1
    27
  • * 晓 *
    老师,MySQL中undo的内容会被记录到redo中吗?比如一个事务在执行到一半的时候实例崩溃了,在恢复的时候是不是先恢复redo,再根据redo构造undo回滚宕机前没有提交的事务呢?

    作者回复: 对的,是你说的这个流程

    2018-11-20
    22
  • null
    帮助记忆:
    视图理解为数据副本,每次创建视图时,将当前『已持久化的数据』创建副本,后续直接从副本读取,从而达到数据隔离效果。

    存在视图的 2 种隔离级别:
    1. 读提交
    2. 可重复读

    读提交:在每一条 SQL 开始执行时创建视图,隔离作用域仅限该条 SQL 语句。

    可重复读:事务启动时创建视图,因此,在事务任意时刻,对记录读取的值都是一样的。

    其他 2 种无视图的隔离级别:
    1. 读未提交
    2. 串行化

    读未提交:直接返回记录最新值。

    串行化:通过读写锁来避免并行访问。
    读-读:允许并发执行
    读-写:只能串行
    写-写:只能串行


    老师,关于视图理解为数据副本,“读-读”在串行化隔离级别允许并发,这样的理解是否适合呢?谢谢

    作者回复: 对,读和读不互斥的

    2018-11-22
    1
    21
  • TimiPai
    林老师,您好,我在书上看到事务隔离级别为“可重复读”时,可能会出现幻读的情况, 幻读书上说是当事务A在读取某个范围内的记录时,事务B又在该范围插入了新的数据,导致事务A读到事务B插入的数据,但是,“可重复读”级别不是提供了一个一致性视图吗,为什么事务B插入的数据会影响到这个视图呢?辛苦您解答了!
    2018-12-10
    4
    16
  • ThinkingQuest
    感谢老师的高质量文章。

    试图的实现,多个回滚段那一块,不是很好理解。
    2018-11-19
    14
  • 王凯
    autocommit设置为1,用文中提到的检查长事务的方法做每秒的计划任务检查,检查到的话记录并杀死进程。

    另外,设置SET GLOBAL MAX_EXECUTION_TIME=3000. 确保单条语句执行时间在规定的范围之内。

    作者回复: 👍🏿

    不过global设下去恐怕担心如果真有需要执行久的,(比如备份),会不会被误伤😄

    可以考虑设置成session内有效,让业务代码主动去做?

    2018-11-19
    13
  • yihang
    在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。

    这种说法似乎不准确:这个视图应该是“在事务内第一次查询时被创建,整个事务存在期间都用这个视图“。
    例如 RR级别下,有记录 id 1, name zhang
    tx1 begin
                              tx 2 begin
                              tx2 update T set name = 'li' where id = 1;
                              tx2 commt;
    tx1 select 结果是li

    作者回复: 事务在第一个select才启动

    2018-11-30
    11
  • 梁中华
    感觉没讲透,最好结合锁一起讲才能彻底讲清楚,比如两个RR级的事务同时启动,都是对同一个字段操作,系统起了两个互不影响的view,那事务的结果会不会被覆盖,直觉上肯定不会被覆盖,大家知道记录上会有锁,但这个锁和view是什么关系呢?建议mvcc可以展开来讲讲。

    作者回复: 涉及到更新是是涉及行锁,在第七讲会讲到。

    2018-11-19
    1
    11
  • xxxl
    老师 同一个事务中的插入/更新/删除->查询,这种情况呢

    作者回复: 那自己改了肯定得看到呀,不然程序逻辑崩溃了😄

    2018-11-19
    9
  • 兔斯基
    是不是可以理解为
    读提交不能保证一个事务中对同一条数据的每次读取都一致。
    可重复读可以保证在一个事务性,每次读取同一条记录,值是不会发生改变的。
    2018-11-19
    9
收起评论
99+
返回
顶部