事务是数据库区别于文件系统的重要特性之一,当我们有了事务就会让数据库始终保持 一致性,同时我们还能通过事务的机制 恢复到某个时间点,这样可以保证已提交到数据库的修改不会因为系统崩溃而丢失。
SHOW ENGINES 命令来查看当前 MySQL 支持的存储引擎都有哪些,以及这些存储引擎是否支持事务
能看出在 MySQL中,只有InnoDB 是支持事务的。
事务:一组逻辑操作单元,使数据从一种状态变换到另一种状态。
事务处理的原则:保证所有事务都作为 一个工作单元 来执行,即使出现了故障,都不能改变这种执行方式。当在个事务中执行多个操作时,要么所有的事务都被提交( commit),那么这些修改就永久地保存下来,要么数据库管理系统将放弃所作的所有 修改,整个事务回滚(rollback) 到最初状态。
#案例:AA用户给BB用户转账100
update account set money = money - 100 where name = 'AA';
#服务器宕机
update account set money = money + 100 where name = 'BB';
原子性(atomicity)
原子性是指事务是一个不可分割的工作单位,要么全部提交,要么全部失败回滚。即要么转账成功,要么转账失败,是不存在中间的状态。如果无法保证原子性会怎么样?就会出现数据不一致的情形,A账户减去100元,而B账户增加100元操作失败,系统将无故丢失100元。
一致性(consistency)
根据定义,一致性是指事务执行前后,数据从一个 合法性状态 变换到另外一个 合法性状态。这种状态是语义上的而不是语法上的,跟具体的业务有关。
那什么是合法的数据状态呢?满足 预定的约束 的状态就叫做合法的状态。通俗一点,这状态是由你自己来定义的(比如满足现实世界中的约束)。满足这个状态,数据就是一致的,不满足这个状态,数据就是不一致的!如果事务中的某个操作失败了,系统就会自动撤销当前正在执行的事务,返回到事务操作之前的状态。
举例1:A账户有200元,转账300元出去,此时A账户余额为-100元。你自然就发现了此时数据是不一致的,为什么呢?因为你定义了一个状态,余额这列必须 >= 0。
举例2:A账户200元,转账50元给B账户,A账户的钱扣了,但是B账户因为各种意外,余额并没有增加。你也知道此时数据是不一致的,为什么呢?因为你定义了一个状态,要求A+B的总余额必须不变。
隔离型 (isolation)
事务的隔离性是指一个事务的执行 不能被其他事务干扰,即一个事务内部的操作及使用的数据对 并发 的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
如果无法保证隔离性会怎么样?假设A账户有200元,B账户0元。A账户往B账户转账两次,每次金额为50元,分别在两个事务中执行。如果无法保证隔离性,会出现下面的情形:
UPDATE accounts SET money = money - 50 WHERE NAME = 'AA';
UPDATE accounts SET money = money + 50 WHERE NAME = 'BB';
持久性 (durability)
持久性是指一个事务一旦被提交,它对数据库中数据的改变就是 永久性的,接下来的其他操作和数据库故障不应该对其有任何影响。
持久性是通过 事务日志 来保证的。日志包括了 重做日志 和 回滚日志。当我们通过事务对数据进行修改的时候,首先会将数据库的变化信息记录到重做日志中,然后再对数据库中对应的行进行修改。这样做的好处是,即使数据库系统崩溃,数据库重启后也能找到没有更新到数据库系统中的重做日志,重新执行,从而使事务具有持久性。
总结
ACID 是事务的四大特性,在这四个特性中,原子性是基础,隔离性是手段,一致性是约束条件,而持久性是我们的目的。
数据库事务,其实就是数据库设计者为了方便起见,把需要保证 原子性、 隔离性、一致性 和 持久性 的一个或多个数据库操作称为一个事务。
事务是一个抽象的概念,它其实对应着一个或多个数据库操作,MySQL根据这些操作所执行的不同阶段把 事务 大致划分成几个状态:
活动的 (active)
事务对应的数据库操作正在执行过程中时,我们就说该事务处在 活动的 状态。
部分提交的 (partially committed)
当事务中的最后一个操作执行完成,但由于操作都在内存中执行,所造成的影响并 没有刷新到磁盘 时,我们就说该事务处在 部分提交的 状态。
失败的 (failed)
当事务处在 活动的 或者 部分提交的 状态时,可遇到了某些错误(数据库自身的错误、操作系统错误或者直接断电等)而无法继续执行,或者人为的停止当前事务的执行,我们就说该事务处在 失败的 状态。
中止的 (aborted)
如果事务执行了一部分而变为 失败的 状态,那么就需要把已经修改的事务中的操作还原到事务执行前的状态。换句话说,就是要撤销失败事务对当前数据库造成的影响。我们把这个撤销的过程称之为 回滚。当回滚操作执行完毕时,也就是数据库恢复到了执行事务之前的状态,我们就说该事务处在了 中止的 状态。
提交的 (committed)
当一个处在 部外提交的 状态的事务将修改过的数据都 同步到磁盘 上之后,我们就可以说该事务处在了 提交的状态。
一个基本的状态转换图如下所示:
图中可见,只有当事务处于 提交的 或者 中止的 状态时,一个事务的生命周期才算是结束了。对于已经提交的事务来说,该事务对数据库所做的修改将永久生效,对于处于中止状态的事务,该事务对数据库所做的所有修改都会被回滚到没执行该事务之前的状态。
使用事务有两种方式,分别为 显式事务 和 隐式事务。
步骤1:START TRANSACTION 或者 BEGIN,作用是显式开启一个事务
START TRANSACTION 语句相较于 BEGIN 特别之处在于,后边能跟随几个 修饰符:
补充:只读事务中只是不允许修改那些其他事务也能访问到的表中的数据,对于临时表来说(我们使用CREATE TMEPORARYTABLE创建的表),由于它们只能在当前会话中可见,所以只读事务其实也是可以对临时表进行增、删、改操作的。
READ WRITE:标识当前事务是一个 读写事务,也就是属于该事务的数据库操作既可以读取数据,也可以修改数据。
WITH CONSISTENT SNAPSHOT: 启动一致性读。
START TRANSACTION READ ONLY; #开启一个只读事务
START TRANSACTION READ ONLY, WITH CONSISTENT SNAPSHOT; #开启只读事务和一致性读
START TRANSACTION READ WRITE, WITH CONSISTENT SNAPSHOT; #开启读写事务和一致性读
注意:
步骤2:一系列事务中的操作 (主要是DML,不含DDL)
步骤3:提交事务或中止事务(即回滚事务)
#提交事务,当提交事务后,对数据的修改是永久性的
COMMIT;#回滚事务,即撤销正在进行的所有没有提交的修改
ROLLBACK;#将事务回滚到某个保存点
ROLLBACK TO [SAVEPOINT];
关于SAVEPOINT相关操作有:
#在事务中创建保存点,方便后续针对保存点进行回滚。一个事务中可以存在多个保存点
SAVEPOINT 保存点名称;#删除某个保存点
RELEASE SAVEPOINT 保存点名称;
MySQL中有一个系统变量 autocommit
默认情况下,如果我们不显式的使用 START TRANSACTION 或者 BEGIN语开启一个事务,那么每一条语句都算是一个独立的事务,这种特性称之为事务的自动提交。
如果我们想关闭自动提交 的功能,可以使用下边两种方法之一:
显式的的使用 START TRANSACTION 或者 BEGIN 语句开启一个事务。这样在本次事务提交或者回滚前会暂时关闭掉自动提交的功能。
把系统变量 autocommit 的值设置为 OFF,就像这样
SET autocommit = OFF;
#或
SET autocommit = 0;
这样的话,我们写入的多条语句就算是属于同一个事务了,直到我们显式的写出 COMMIT 语句来把这个事务提交掉,或者显式的写出 ROLLBACK 语来把这个事务回滚掉。
补充: Oracle 默认不自动提交,需要手写 COMMIT 命令,而 MySQL默认自动提交。
数据定义语言 (Data definition language,缩写为: DDL)
数据库对象,指的就是 数据库、表、视图、存储过程 等结构。当我们使用 CREATE、ALTER、DROP 等语句去修改数据库对象时,就会隐式的提交前边语句所属于的事务。
BEGIN;
SELECT... # 事务中的一条语句
UPDATE... # 事务中的一条语句
... #事务中的其它语句
CREATE TABLE... # 此语句会隐式的提交前边语句所属于的事务
隐式使用或修改mysql数据库中的表
当我们使用 ALTER USER、CREATE USER、DROP USER、GRANT、RENAME USER、REVOKE、SET PASSWORD 等语句时也会隐式的提交前边语句所属于的事务。
事务控制或关于锁定的语句
当我们在一个事务还没提交或者回滚时就又使用START TRANSACTION 或者BEGIN语开启了另一个事务时,会 隐式的提交 上一个事务。即:
BEGIN;
SELECT... # 事务中的一条语句
UPDATE... # 事务中的一条语句
...#事务中的其它语句
BEGIN;# 此语句会隐式的提交前边语句所属于的事务
当前的 autocommit 系统变量的值为 OFF,我们手动把它调为 ON 时,也会 隐式的提交前边语句所属的事务。
使用LOCK TABLES、UNLOCK TABLES 等关于锁定的语句也会 隐式的提交前边语句所属的事务。
加载数据的语句
使用LOAD DATA 语句来批量往数据库中导入数据时,也会 隐式的提交 前边语句所属的事务。
关于MySQL复制的一些语句
使用 START SLAVE、STOP SLAVE、RESET SLAVE、CHANGE MASTER TO 等语时会隐式的提交前边语句所属的事务。
使用 ANALYZE TABLE、 CACHE INDEX、CHECK TABLE、FLUSH、 LOAD INDEX INTO CACHE、OPTIMIZE TABLE、REPAIR TABLE、RESET 等语句也会隐式的提交前边语句所属的事务。
MySQL中completion_type 参数的作用,实际上这个参数有3种可能:
当我们设置autocommit=0 时,不论是否采用 START TRANSACTION 或者 BEGIN 的方式来开启事务,都需要用COMMIT进行提交,让事务生效,使用 ROLLBACK 对事务进行回滚。
当我们设置autocommit=1时,每条SQL 语都会自动进行提交。
不过这时,如果你采用START TRANSACTION 或者BEGIN 的方式来显式地开启事务,那么这个事务只有在COMMIT 时才会生效,在ROLLBACK时才会回滚。
MySQL是一个客户端/服务器架构的软件,对于同一个服务器来说,可以有若干个客户端与之连接,每个客户端与服务器连接上之后,就可以称为一个会话(Session)。每个客户端都可以在自己的会话中向服务器发出请求语句,一个请求语句可能是某个事务的一部分,也就是对于服务器来说可能同时处理多个事务。事务有 隔离性的特性,理论上在某个事务 对某个数据进行访问 时,其他事务应该进行 排队,当该事务提交之后,其他事务才可以继续访问这个数据。但是这样对 性能影响太大,我们既想保持事务的隔离性,又想让服务器在处理访问同一数据的多个事务时 性能尽量高些 ,那就看二者如何权衡取舍了
针对事务的隔离性和并发性,我们怎么做取舍呢?先看一下访问相同数据的事务在 不保证串行执行 (也就是执行完一个再执行另一个)的情况下可能会出现哪些问题:
对于两个事务 Session A、Session B,如果务Session A修改了另一个未提交事务Session B 修改过的数据,那就意味着发生了 脏写,示意图如下
Session A和Session B各开启了一个事务,Session B中的事务先将studentno列为1的记录的name列更新为李四然后Session A中的事务接着又把这条studentno列为1的记录的name列更新为张三。如果之后Session B中的事务进行了回滚,那么Session A中的更新也将不复存在,这种现象就称之为脏写。这时Session A中的事务就没有效了,明明把数据更新了,最后也提交事务了,最后看到的数据什么变化也没有。这里大家对事务的隔离级比较了解的话,会发现默认隔离级别下,上面SessionA中的更新语句会处于等待状态,这里只是跟大家说明一下会出现这样现象。
对于两个事务 Session A、Session B,Sessidn A 读取了已经被 Session B 更新还没有被提交的字段。Session B 回滚,Session A 读取 的内容就是 临时且无效的。
Session A和Session B各开启了一个事务,Session B中的事务先将studentno列为1的记录的name列更新为张三,然后Session A中的事务再去查询这条studentno为1的记录,如果读到列name的值为张三,而Session B中的事务稍后进行了回滚,那么Session A中的事务相当于读到了一个不存在的数据,这种现象就称之为脏读。
对于两个事务Session A、Session B,Session A 读取了一个字段,然后 Session B 更新了该字段。之后SessionA再次读取 同一个字段,值就不同了。那就意味着发生了不可重复读。
我们在Session B中提交了几个 隐式事务 (注意是隐式事务,意味着语句结束事务就提交了),这些事务都修改了studentno列为1的记录的列name的值,每次事务提交之后,如果Session A中的事务都可以查看到最新的值,这种现象也被称之为 不可重复读
对于两个事务Session A、Session B, Session A从一个表中读取了一个字段,然后 Session B 在该表中插入了一些新的行。之后,如果 Session A 再次读取 同一个表,就会多出几行。那就意味着发生了幻读.
Session A中的事务先根据条件 studentno>0这个条件查询表student,得到了name列值为张三的记录;之后Session B中提交了一个隐式事务,该事务向表student中插入了一条新记录,之后Session A中的事务再根据相同的条件 studentno>0查询表student,得到的结果集中包含Session B中的事务新插入的那条记录,这种现象也被称之为 幻读 。我们把新插入的那些记录称之为 幻影记录。
注意1:
有的同学会有疑问,那如果 Session B 中删除了一些符合 studentno > 的记录而不是插入新记录,那Session A之后再根据 studentno > 的条件读取的 记录变少了,这种现象算不算幻读 呢?这种现象 不属于幻读,幻读强调的是一个事务按照某个 相同条件多次读取 记录时,后读取时读到了之前 没有读到的记录。
注意2:
那对于先前已经读到的记录,之后又读取不到这种情况,算啥呢?这相当于对每一条记录都发生了 不可重复读的现象。幻读只是重点强调了读取到了之前读取没有获取到的记录。
这里要灵活的 理解读取 的意思,第一次select是读取,第二次的 insert 其实也属于隐式的读取,只不过是在 mysql的机制中读取的,插入数据也是要先读取一下有没有主键冲突才能决定是否执行插入。
幻读,并不是说两次读取获取的结果集不同,幻读侧重的方面是某一次的 select 操作得到的结果所表征的数据状态无法支撑后续的业务操作。更为具体一些: select 某记录是否存在,不存在,准备插入此记录,但执行insert时发现此记录已存在,无法插入,此时就发生了幻读。
在RR 隔离级别下,step1、step2 是会正常执行的,step3 则会报错主键冲突,对于事务1的业务来说是执行失败的,这里事务1就是发生了幻读,因为事务1 在 step1 中读取的数据状态并不能支撑后续的业务操作,事务1:“见鬼了,我刚才读到的结果应该可以支持我这样操作才对啊,为什么现在不可以”。事务1 不敢相信的又执行了step4 ,发现和 setp1 读取的结果是一样的(RR下的 MVCC机制)。此时,幻读无疑已经发生,事务1 无论读取多少次,都查不到 id=3 的记录,但它的确无法插入这条他通过读取来认定不存在的记录(此数据已被事务2插入),对于事务1 来说,它幻读了。
其实 RR 也是可以避免幻读的,通过对 select 操作手动加行X锁(独占锁) (SELECT … FOR UPDATE 这也正是SERIALIZABLE 隔离级别下会隐式为你做的事情)。同时,即便当前记录不存在,比如 id=3 是不存在的,当前事务也会获得一把记录锁(因为InnoDB的行锁锁定的是索引,故记录实体存在与否没关系,存在就加 行X锁,不存在就加 间隙锁 ),其他事务则无法插入此索引的记录,故杜绝了幻读。
在 SERIALIZABLE 隔离级别下,step1 执行时是会隐式的添加 行(X)锁 / gap(X)锁 的,从而 step2 会被阻塞step3 会正常执行,待事务1 提交后,事务2才能继续执行(主键冲突执行失败),对于事务1 来说业务是正确的,成功的阻塞扼杀了扰乱业务的事务2,对于事务1来说他前期读取的结果是可以支撑其后续业务的。
所以 MySQL 的幻读并非什么读取两次返回结果集不同,而是事务在插入事先检测不存在的记录时,惊奇的发现这些数据已经存在了,之前的检测读获取到的数据如同鬼影一般。
上面介绍了几种并发事务执行过程中可能遇到的一些问题,这些问题有轻重缓急之分,我们给这些问题按照严重性来排一下序:
脏写 > 脏读 > 不可重复读 > 幻读
我们愿意舍弃一部分隔离性来换取一部分性能在这里就体现在: 设立一些隔离级别,隔离级别越低,并发问题发生的就越多。SQL标准 中设立了4个 隔离级别:
SQL标准 中规定,针对不同的隔离级别,并发事务可以发生不同严重程度的问题,具体情况如下:
脏写问题太严重,在任何一种隔离级别,都不允许脏写的情况发生。
不同的隔离级别有不同的现象,并有不同的锁和并发机制,隔离级别越高,数据库的并发性能就越差,4种事务隔离级别与并发性能的关系如下:
不同的数据库厂商对SQL标准中规定的四种隔离级别支持不一样。比如,oracle 就只支持 READ COMMITTED(默认隔离级别)和 SERIALIZABLE隔离级别。MySOL虽然支持4种隔离级别,但与SQL标准中所规定的各级隔离级别允许发生的问题却有些出入,MySQL在REPEATABLE READ隔离级别下,是可以禁止幻读问题的发生的。
MySQL的默认隔离级别为REPEATABLE READ,我们可以手动修改一下事务的隔离级别:
# 查看隔离级别,MySQL 5.7.20的版本之前:
mysq1> SHOW VARIABLES LIKE 'tx_isolation';# MySQL 5.7.20版本之后,引入transaction_isolation来替换tx_isolation# 查看隔离级别,MySQL 5.7.20的版本及之后:
mysql> SHOW VARIABLES LIKE 'transaction_isolation';#或者不同MySQL版本中都可以使用的:
SELECT @@transaction_isolation;
通过下面的语句修改事务的隔离级别:
SET [GLOBAL | SESSION] TRANSACTION ISOLATION LEVEL 隔离级别;
#其中,隔离级别格式:
> READ UNCOMMITTED
> READ COMMITTED
> REPEATABLE READ
> SERIALIZABLE
或者:
SET [GLOBAL | SESSION] TRANSACTION ISOLATION = '隔离级别';
#其中,隔离级别格式:
> READ-UNCOMMITTED
> READ-COMMITTED
> REPEATABLE-READ
> SERIALIZABLE
使用 GLOBAL 关键字 (在全局范围影响)
SET GLOBAL TRANSACTION ISOLATION LEVEL SERIALIZABLE;
#或
SET GLOBAL TRANSACTION_ISOLATION = 'SERIALIZABLE';
使用 SESSION 关键字 (在会话范围影响)
SET SESSION TRANSACTION ISOLATION LEVEL SERIALIZABLE;
#或
SET SESSION TRANSACTION_ISOLATION = 'SERIALIZABLE';
如果在服务器启动时想改变事务的默认隔离级别,可以修改启动参数 transaction_isolation 的值。比如,在启动服务器时指定了 transaction_isolation=SERIALIZABLE,那么事务的默认隔离级别就从原来的REPEATABLE-READ 变成了 SERIALIZABLE.
从事务理论的角度来看,可以把事务分为以下几种类型:
下面分别介绍这几种类型:
扁平事务 是事务类型中最简单的一种,但是在实际生产环境中,这可能是使用最频繁的事务,在扁平事务中,所有操作都处于同一层次,其由BEGIN WORK开始,由COMMIT WORK或ROLLBACK WORK结束,其间的操作是原子的,要么都执行,要么都回滚,因此,扁平事务是应用程序成为原子操作的基本组成模块。扁平事务虽然简单,但是在实际环境中使用最为频繁,也正因为其简单,使用频繁,故每个数据库系统都实现了对扁平事务的支持。扁平事务的主要限制是不能提交或者回滚事务的某一部分,或分几个步骤提交。
扁平事务一般有三种不同的结果:
①事务成功完成。在平常应用中约占所有事务的96%。
②应用程序要求停止事务。比如应用程序在捕获到异常时会回滚事务,约占事务的3%。
③外界因素强制终止事务。如连接超时或连接断开,约占所有事务的1%。
带有保存点的扁平事务 除了支持扁平事务支持的操作外,还允许在事务执行过程中回滚到同一事务中较早的一个状态。这是因为某些事务可能在执行过程中出现的错误并不会导致所有的操作都无效,放弃整个事务不合乎要求,开销太大。
**保存点(Savepoint)**用来通知事务系统应该记住事务当前的状态,以便当之后发生错误时,事务能回到保存点当时的状态。对于扁平的事务来说,隐式的设置了一个保存点,然而在整个事务中,只有这一个保存点,因此,回滚只能会滚到事务开始时的状态。
链事务 是指一个事务由多个子事务链式组成,它可以被视为保存点模式的一个变种。带有保存点的扁平事务,当发生系统崩溃时,所有的保存点都将消失,这意味着当进行恢复时,事务需要从开始处重新执行,而不能从最近的一个保存点继续执行链事务的思想 是:在提交一个事务时时,释放不需要的数据对象,将必要的处理上下文隐式地传给下一个要开始的事务,前一个子事务的提交操作和下一个子事务的开始操作合并成一个原子操作,这意味着下一个事务将看到上一个事务的结果,就好像在一个事务中进行一样。这样,在提交子事务时就可以释放不需要的数据对象,而不必等到整个事务完成后才释放。其工作方式如下
链事务与带有保存点的扁平事务的不同之处体现在:
①带有保存点的扁平事务能回滚到任意正确的保存点,而链事务中的回滚仅限于当前事务,即只能恢复到最近的一个保存点。
②对于锁的处理,两者也不相同,链事务在执行COMMIT后即释放了当前所持有的锁,而带有保存点的扁平事务不影响迄今为止所持有的锁。
嵌套事务是一个层次结构框架,由一个顶层事务(Top-Level Transaction)控制着各个层次的事务,顶层事务之下嵌套的事务被称为子事务 (Subtransaction),其控制着每一个局部的变换,子事务本身也可以是嵌套事务.因此,嵌套事务的层次结构可以看成是一棵树。
分布式事务 通常是在一个分布式环境下运行的扁平事务,因此,需要根据数据所在位置访问网络中不同节点的数据库资源。例如,一个银行用户从招商银行的账户向工商银行的账户转账1000元,这里需要用到分布式事务,因为不能仅调用某一家银行的数据库就完成任务。
下一篇:工作订单生命流程