恢复技术 Flashcards
事务与程序
是两个概念。一般,一个程序中包含多个事务。
事务
是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位。
事务的开始与结束可以由用户显式控制。如果用户没有显式地定义事务,则由DBMS按缺省规定自动划分事务。
事务是恢复和并发控制的基本单位。
在SQL中,定义事务的语句
BEGIN TRANSACTION
COMMIT
ROLLBACK
事务通常是以BEGIN TRANSACTION开始,以COMMIT或ROLLBACK结束。
COMMIT
表示提交,即提交事务的所有操作。将事务中所有对数据库的更新写回到磁盘上的物理数据库中去,事务正常结束。
ROLLBACK
表示回滚,即在事务运行的过程中发生了某种故障,事务不能继续执行,系统将事务中对数据库的所有已完成的操作全部撤销,回滚到事务开始时的状态。这里的操作指对数据库的更新操作。
事务的特性
原子性Atomicity,一致性Consistency,隔离性Isolation,持续性Durability。
简称为ACID特性。
保证事务ACID特性是事务管理的重要任务。
原子性Atomicity
事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做。
一致性Consistency
事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。
当数据库只包含成功事务提交的结果时,就说数据库处于一致性状态。
一致性与原子性是密切相关的。
为什么事务非正常结束时会影响数据库数据的正确性
事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。
如果数据库系统运行中发生故障,有些事务尚未完成就被迫中断,这些未完成事务对数据库所做的修改有一部分已写入物理数据库,这时数据库就处于一种不正确的状态,或者说是不一致的状态。
隔离性Isolation
一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他的并发事务是隔离的,并发执行的各个事务之间不能相互干扰。
持续性Durability
持续性也称永久性,指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。
事务ACID特性可能遭到破坏的因素
1。多个事务并行运行时,不同事务是操作交叉执行。
2。事务在运行过程中被强行停止。
数据库中为什么要有恢复子系统
因为计算机系统中硬件的故障、软件的错误、操作员的失误及恶意的破坏都是不可避免的,这些故障轻则造成当前运行事务非正常中断,影响数据库中数据的正确性,重则破坏数据库,使数据库中全部或部分数据丢失。
数据库恢复(恢复子系统的功能)
数据库管理系统把数据库从错误状态恢复到某一已知的正确状态(一致状态或完整状态)的功能。
数据库管理系统中恢复机制和并发机制的责任
1。多个事务并行运行时,数据库管理系统必须保证多个事务的交叉运行不影响这些事务的原子性。
2。事务在运行过程中被强行停止时,数据库管理系统必须保证被强行终止的事务对数据库和其他事务没有任何影响。
数据库运行过程中可能产生的故障类型
1。事务内部故障。
2。系统故障。
3。介质故障。
4。计算机病毒。
事务内部故障
有的是可以通过事务程序本身发现的,有的是非预期的,不能由事务程序处理的。
事务内部更多的故障是非预期的,是不能由应用程序处理的。如运算溢出、并发事务发生死锁而被选中撤销该事务、违反了某些完整性限制等。
以后,事务故障仅指这类非预期的故障。
事务撤销(UNDO)
事务故障意味着事务没有达到预期的终点(COMMIT或者显式的ROLLBACK),因此,数据库可能处于不正确状态。恢复程序要在不影响其他事务运行的情况下,强行回滚该事务,即撤销该事务已经作出的任何对数据库的修改,使得该事务好像根本没有启动一样。
系统故障
指造成系统停止运转的任何事件,使得系统要重新启动。例如,特定类型的硬件错误(CPU故障)、操作系统故障、DBMS代码错误、系统断电等。这类故障影响正在运行的所有事务,但不破坏数据库。这时主存内容,尤其是缓冲区(在内存)中的内容都被丢失,所有运行事务都非正常终止。发生系统故障时,一些尚未完成的事务的结果可能已送入物理数据库,从而造成数据库可能处于不正确的状态。为保证数据一致性,需要清除这些事务对数据库的所有修改。
恢复子系统必须在系统重新启动时让所有非正常终止的事务回滚,强行撤销(UNDO)所有未完成事务。
另一方面,发生系统故障时,有些已完成的事务可能有一部分甚至全部留在缓冲区,尚未写回到磁盘上的物理数据库中,系统故障使得这些事务对数据库的修改部分或全部丢失,这也会使数据库处于不一致状态,因此应将这些事务已提交的结果重新写入数据库。所以,恢复子系统除需要撤销所有未完成的事务外,还需要重做(REDO)所有已提交的事务,以将数据库真正恢复到一致状态。
介质故障
系统故障常称为软故障,介质故障称为硬故障。硬故障指外存故障,如磁盘损坏、磁头碰撞、瞬时强磁场干扰等。这类故障将破坏数据库或部分数据库,并影响正在存取这部分数据的所有事务。这类故障比前两类故障发生的可能性小很多,但破坏性最大。
各类故障的数据库的影响的可能性
一是数据库本身被破坏。二是数据库没有被破坏,但数据可能不正确,这是由于事务的运行被非正常终止造成的。
计算机病毒
是一种人为的故障或破坏,是一些恶作剧者研制的一种计算机程序。这种程序与其他程序不同,它像微生物学所称的病毒一样可以繁殖和传播,并造成对计算机系统包括数据库的危害。
病毒的种类很多,不同病毒有不同的特征。小的病毒只有20条指令,不到50B。大的病毒像一个操作系统,由上万条指令组成。
有的病毒传播很快,一旦侵入系统就马上摧毁系统;有的病毒感染系统所有的程序和数据;有的只对某些特定的程序和数据感兴趣。多数病毒一开始并不摧毁整个计算机系统,它们只在数据库中或其他数据文件中将小数点向左或向右移一移,增加或删除一两个"0"。
计算机病毒已成为计算机系统的主要威胁,自然也是数据库系统的主要威胁。为此计算机的安全工作者已研制出了许多预防病毒的"疫苗",检查、诊断、消灭计算机病毒的软件也在不断发展。但是,至今还没有一种可以使计算机"终生"免疫的疫苗。因此数据库一旦被破坏仍要用恢复技术把数据库加以恢复。
恢复机制涉及的两个关键问题
第一,如何建立冗余数据。
第二,如何利用这些冗余数据实施数据库恢复。
建立冗余数据最常用的技术(数据库恢复的基本技术)
数据转储和登录日志文件。
通常在一个数据库系统中,这两种方法是一起使用的。
当系统在运行过程中发生故障时,利用所转储的数据库后备副本和日志文件就能把数据库恢复到故障发生前的某个一致性状态。
数据转储
是数据库恢复中采用的基本技术。所谓转储即DBA定期地将整个数据库复制到磁带或另一个磁盘上保存起来的过程。这些备用的数据称为后备副本或后援副本。
当数据库遭到破坏后可以将后备副本重新装入,但重装后备副本只能将数据库恢复到转储时的状态,要向恢复到故障发生时的状态,必须重新运行自转储以后的所有更新事务。
转储是十分耗费时间和资源的,不能频繁进行。DBA应该根据数据库使用情况确定一个适当的转储周期。
转储状态
静态转储和动态转储。