并发控制 Flashcards
事务并行执行
事务可以一个一个地串行执行,即每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行。事务在执行过程中需要不同的资源,有时需要CPU,有时需要存取数据库,有时需要I/O,有时需要通信。如果事务串行执行,则许多系统资源将处于空闲状态。因此,为了充分利用系统资源发挥数据库共享资源的特点,应该允许多个事务并行执行。
多用户数据库系统
允许多个用户同时使用的数据库系统。
例如飞机定票数据库系统、银行数据库系统等。
在这样的系统中,在同一时刻并发运行的事务数可达数百个。
交叉并发方式
在单处理机系统中,事务的并行执行实际上是这些并行事务的并行操作轮流交叉运行。
虽然单处理机系统中的并行事务没有真正并行运行,但是减少了处理机的空闲时间,提高了系统的效率。
同时并发方式
在多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行。
为什么要在数据库中进行并发控制机制
数据库是共享资源,通常有许多事务同时运行。当多个用户并发地存取数据库时就会产生多个事务同时存取同一数据的情况。若对并发操作不加控制就可能会存取和存储不正确的数据,破坏事务的一致性和数据库的一致性。所以数据库管理系统必须提供并发控制机制。并发控制机制是衡量一个数据库管理系统性能的重要指标之一。
数据库管理系统中并发控制机制的责任
为了保证事务的隔离性和一致性,DBMS需要对并发操作进行正确调度。
并发操作带来的数据不一致性
丢失修改、不可重复读和读"脏"数据。
丢失修改
两个事务T1和T2同时读入同一数据并修改,T2提交的结果破坏了T1提交的结果,导致T1的修改被丢失。
不可重复读
事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。
不可重复读的三种情况
1。事务T1读取某一数据后,事务T2对其做了修改,当事务T1再次读该数据时,得到与前一次不同的值。
2。事务T1按一定条件从数据库中读取了某些数据记录后,事务T2删除了其中部分记录,当T1再次按相同条件读取数据时,发现某些记录神秘地消失了。
3。事务T1按一定条件从数据库中读取了某些数据记录后,事务T2插入了一些记录,当T1再次按相同条件读取数据时,发现多了一些记录。
后两种不可重复读有时也称为幻影现象。
读"脏"数据
事务T1修改某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,则T2读到的数据就为"脏"数据,即不正确的数据。
产生数据不一致性的主要原因
并发操作破坏了事务的隔离性。
并发控制
并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。
另一方面,对数据库的应用程序有时允许某些不一致性。例如有些统计工作涉及数据量很大,读到一些"脏"数据对统计精度没什么影响,这时可以降低对一致性的要求以减少系统开销。
并发控制技术能够保证事务的哪些特性
可以保证事务的一致性和隔离性,保证数据库的一致性。
并发控制的主要技术
封锁、时间戳和乐观控制法。
商用的DBMS一般都采用封锁方法。
(在分布式数据库系统中,常采用时间戳方法。)
封锁
封锁是实现并发控制的一个非常重要的技术。
所谓封锁就是事务T在对某个数据对象例如表、记录等操作之前,先向系统发出请求,对其加锁。加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其他的事务不能更新此数据对象。
基本的封锁类型
确切的控制由封锁的类型决定。
排它锁(X锁)和共享锁(S锁)。
排它锁
排它锁又称为写锁。若事务T对数据对象A加上X锁,则只允许T读取和修改A,其他任何事务都不能再对A加任何类型的锁,直到T释放A上的锁。这就保证了其他事务在T释放A上的锁之前不能再读取和修改A。
共享锁
共享锁又称为读锁。若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其他任何事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。这就保证了其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改。
如何用封锁机制保证数据的一致性
DBMS在对数据进行读写操作之前,首先对该数据执行封锁操作。例如,事务T1在对A进行修改之前,先对A执行Xlock(A),即对A加X锁。这样,当T2请求对A加X锁时,就被拒绝,T2只能等待T1释放A上的锁后才能对A加X锁,这时它所读到的A是T1更新后的值,再按此新的A值进行运算,就不会丢失T1所做的更新。
DBMS按照一定的封锁协议对并发操作进行控制,使得多个并发操作能够有序地执行,可以避免丢失修改、不可重复读和读"脏"数据等数据不一致性。
排它锁与共享锁的相容矩阵
X S - X N N Y S N Y Y - Y Y Y 最左边一列表示事务T1已经获得的数据对象上的锁的类型,其中横线表示没有加锁。最上面一行表示另一事务T2对同一数据对象发出的封锁请求。T2的封锁请求能否被满足用矩阵中的Y和N表示,其中Y表示T2的封锁要求与T1已持有的封相容,封锁请求可以满足。N表示T2的封锁请求与T1已持有的封冲突,T2的请求被拒绝。
活锁的产生原因
当一系列封锁不能按照其先后顺序执行时,可能导致一些事务无限期地等待某个封锁,从而导致活锁。
封锁与活锁和死锁问题
封锁的方法可能引起活锁和死锁等问题。
活锁
如果事务T1封锁了数据R,事务T2又请求封锁R,于是T2等待。T3也请求封锁R,当T1释放了R上的封锁之后系统首先批准了T3的请求,T2仍然等待。然后T4又请求封锁R,当T3释放了R上的封锁之后系统又批准了T4的请求……T2有可能永远等待。
活锁的含义是某等待事务的等待时间过长,似乎被锁住了一样,实际上有可能被激活。
避免活锁的简单方法
采用先来先服务策略。当多个事务请求封锁同一数据对象时,封锁子系统按请求封锁的先后次序对事务排队,数据对象上的锁一旦释放就批准申请队列中第一个事务获得锁。
死锁
如果事务T1封锁了数据R1,T2封锁了数据R2,然后T1又请求封锁R2,因T2已封锁了R2,于是T1等待T2释放R2上的锁。接着T2又申请封锁R1,因T1已封锁了R1,T2也只能等待T1释放R1上的锁。这样就出现了T1在等待T2,而T2又在等待T1的局面,T1和T2两个事务永远不能结束,形成死锁。