【分布式数据库】笔记

Database Review

Overview

History

分布式数据库系统的研究始于20世纪70年代

第一个分布式数据库系统 SDD-1由CCA公司于 1979年在DEC机上实现

较早的DDBMS：POREL、System R*、 Distributed INGRES、C-POREL

数据分片（data fragmentation）

水平分片
垂直分片
混合分片
导出分片

分片规则

完备性条件
可重构条件
不相交性条件

数据分布（data distribution）

根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上

集中式（安排在同一站点上）
分割式（分布在不同站点上，无冗余）
复制式（每个站点都有一个完整的副本）
混合式（分割式和复制式的混合，有冗余）

模式结构

全局外模式：全局应用的用户视图
全局概念模式：全体数据的逻辑结构和特征的描述。
分片模式：描述每个片段及全局关系与片段间的映象，片段间不允许重复
分配模式（决定是否冗余）：描述片段到不同结点间的映象（片段的存放位置）
局部概念模式 ：全局概念模式的子集在一个站点上的物理映像的逻辑结构及特征描述
局部内模式 ：描述局部概念模式涉及的数据在局部DBMS中的物理存储

特点

数据分片与数据分布独立
数据冗余显式控制
局部DBMS独立

DDBMS 功能结构

除集中式数据库的基本功能，还必须提供：

数据跟踪：利用日志记录数据分布、分片和复制的能力
分布式查询处理
分布式事务处理
复制数据的管理
数据完整性与安全性管理
分布式目录管理
站点间的通信

数据独立性

集中式

逻辑独立性
物理独立性

分布式

逻辑独立性
物理独立性
分布独立性（分布透明性）
- 分片透明性（完全分布透明性，Level 1）
- 分配（位置）透明性（中级分布透明性，Level 2）
- 局部映象（数据模型）透明性（低级分布透明性，Level 3）
- 无分布透明性：异构数据

其他透明性

并发透明性
故障透明性
复制透明性
语言透明性
网络透明性

Architecture

The architecture of a system defines its structure. This means that the components of the system are identified, the function of each component is specified, and the interrelationships and interactions among these components are defined.

The specification of the architecture of a system requires identification of the various modules, with their interfaces and interrelationships, in terms of the data and control flow through the system.

Design

组合法（自底向上）

剖析网络功能
剖析原有数据库系统
解决数据的一致性、完整性和可靠性
难度较大，通常是异构或者同构异质 DDBS

重构法（自顶向下）

根据实现环境和用户需求
按照DDBS的设计思想和方法
从总体设计做起(包括LDBS）重新建立一个 DDBS
可有效解决数、据一致性、完整性和可靠性问题。通常是同构异质或同构同质 DDBS

混合法

目标

分布式数据库的本地性或近地性：数据存放在最频繁访问的地方（90/10准则）
控制数据的适当冗余：冗余增加了可用性、可靠性，提高了效率，也增加维护一致性的开销
工作负荷分布：各站点上存取应用尽量平衡，提高并行度和效率，但可能降低本地性
存储能力和费用：根据站点的存储容量分布数据，也可由专门的站点存储数据

自顶向下

数据分片设计

分片目的：产生一个对全局数据合适的分片方案

将分片片段作为存储和分配单位时，能够减少应用的数据操作量；
对数据的存取具有最大可能的本地性，即使得应用能够尽量存取本站点的数据。

分片类型和方法

水平分片（基本的水平分片和导出的水平分片）
垂直分片
混合分片

水平分片性质

如果某个谓词pi将某个片段f，进一步分解为fi和fj，而且至少有一个应用对fi和fj的访问是不同的，那么此谓词pi就是相关的（relevant）；
如果所有谓词都是与应用相关的，那么这个谓词集合就是最小的；
完整性和最小性不是必要条件，但是对于简化分配问题有好处。

算法生成分片

水平分片实际应用

确定谓词集合是否完备可能开销很大，一般（建议）不考虑所有应用，而是考虑重要应用；
不区分具有相似特征的数据片；
得到兼顾效率的合适的水平分片

导出的水平分片

从另一个关系的属性性质或水平分片推导出来的
一般涉及多个关系
可使关系之间的连接变得更容易

垂直分片

通过“投影”操作把一个全局关系分成若干片段，基本目标是将使用频繁的属性聚集在一起

垂直分片设计

统计属性的亲和关系
构造属性亲和矩阵
寻找属性分割点

亲和关系

垂直分片与模式分解

类似，目的不一样；
模式分解是为了概念的单一化，是概念设计的内容；
垂直分片是为了数据的分布，是概念设计之后的内容；
模式分解需要考虑数据依赖；
垂直分片考虑的是数据的聚集性。

位置分配设计

在满足用户需求的前提下，把设计好的数据片段分配到相应的站点上，尽可能提高系统效益

费用和得益估算

水平分片估算

垂直分片估算

小结

设计最佳的分配方案是一个复杂的优化问题；
如果要求高可用性，且大多是检索应用，全复制是比较好的选择；
如果大多是在确定站点上的部分应用，应用数据应该复制到这些站点上；
如果执行许多更新，则要限制复制的副本；
从经验数据看副本数为2或3时收益较为理想。

DATAID-D方法

分布要求分析

分布设计

自底向上

自底向上方法要解决的问题

将现有的各种不同的数据库模式集成为全局模式
需要解决不同数据库之间的不一致

解决方法

在全局分布式层采用统一的数据模型表示

处理步骤

选择公用数据库模型来描述数据库的全局模式
把每个站点上的本地模式翻译成公用数据模型
把各站点上的本地数据模式集成为一公用的全局模式

构造全局模式（超视图）的方法

把各站点上的数据库模式看成是全局模式的一个视图
采用概括分层结构进行视图综合
- 共同属性构成超类型，“差”属性各建一个子类型
- 一个具有共同属性（超类型），两个具有不相交属性（子类型）

视图综合次序

一次把一个视图和全局模式进行综合，逐步构造起全局视图
首先综合最大的或最重要的视图，然后综合小的或者不重要的视图

视图综合需要解决的问题

识别相似性
在已有的不同模式间识别属性、域或实体结构的相似部分，判别是否能够合并实体或概括为上层实体。
识别冲突
在识别相似的基础上，分析相似数据的不同表示或域定义。通过引入差异或采用折中的方法解决冲突。
- 命名冲突：同物异名，异物同名
- 域差异：不同站点上的相同实体有不同的域
- 定标差异：不同模式的相同属性有不同度量标准
- 结构差异：现实世界中的同一对象有不同表示（属性或实体）
处理操作间的不一致数据
- 不一致的现象
  - 同一对象在不同站点有相同标识符；
  - 同一对象在不同站点有不同的值；
  - 同一对象有新值和旧值；
  - 其它不符合逻辑的错误
- 解决策略
  - 直接显示任一不一致值，且不通知用户
  - 直接显示不一致，通知用户，让用户处理
  - 将不一致值处理为一个新的结果，如求平均值
  - 显示最新值
  - 显示最可靠系统的值

Query Optimization

查询优化准则

集中式

查询转换为代数表达式
从所有等价表达式中选择最优的代数表达式

分布式

集中式问题
站点之间交换数据的问题
选择最优执行站点的问题
数据传送方式的问题

数据的分布和冗余增加了并行处理查询的可能性，从而可以缩减查询处理的响应时间。

总代价最小
响应时间最短
- 查询响应时间：与通信时间、站点上的处理时间有关
- 可利用站点间的并行处理缩短查询时间

关系代数

连接

等值连接

自然连接

半连接

校正：

虽然半连接通常是基于等值条件的，但它的定义并不限制于等值连接。

外连接

限定关系

分布式查询分类

局部查询
远程查询
全局查询

局部查询

选择运算尽可能先做
把投影运算和选择运算同时进行
把投影同其前或后的双目运算结合起来
把某些选择运算和在它前面执行的笛卡尔积结合起来成为一个连接运算
在执行连接前对关系适当地预处理（在连接属性上建立索引和对关系排序）
找出公共子表达式

远程查询

只涉及单个站点上的数据，优化策略与局部查询相同
在有多个站点的情况下，就近处理

全局查询

具体化（materialization）
- 对查询进行分解，确定查询使用的物理副本，落实查询对象
- 对于多个副本，需研究如何选择副本，使通信代价最小，并提高处理的并行性。
确定操作执行的顺序
- 确定二元操作中连接和并操作的顺序
  - 先执行所有连接，再执行并操作
  - 先执行部分并操作，再执行连接操作
- 选择和投影尽可能早进行
确定操作的执行方法
- 确定若干个操作的合并执行，确定可用的访问路径
- 连接方法在查询优化中起着重要作用
确定执行站点
- 考虑通讯费用和执行效率（负载均衡）
- 执行站点不一定是发出查询的站点

分布式查询优化

基本原理

把查询转变为关系代数表达式
分析得到查询树（语法树）
把全局查询映射为片段的查询，得到基于片段的查询树
利用关系代数等价变换规则优化查询树

处理步骤

将关系表达式表示为语法树的形式；
利用等价变换规则尽量将选择和投影运算移向树的叶端，连接和合并操作尽可能上提；
使多个选择和多个投影一起进行；
将树的内部结点分组，形成不同的程序步。

优化算法

分布式环境中的特殊处理

如果是水平分片，把分片的限定（分片条件）与选择条件进行比较，判别它们之间是否存在矛盾，去掉存在矛盾的片段。
如果只剩一个水平片段，则可去掉重构全局关系的“并”操作。
如果是垂直分片，把片段中的属性集与投影操作涉及的属性集进行比较，去掉无关的片段。
如果只剩一个垂直片段，则去掉重构全局关系的“连接”操作。

水平分片查询优化

尽量把选择条件下移到分片的限定关系处，再把分片的限定关系与选择条件进行比较，去掉它们之间存在矛盾的相应片段。
如果最后剩下一个水平片段，则在重构全局关系的操作中，就可去掉“并”操作。

基于半连接的查询优化

s上基于半连接技术执行连接

代价估算

基于直接连接的查询优化

四种基于直接连接的优化算法（考虑关系分片）

利用站点依赖信息的算法
分片与复制算法
站点依赖和数据复制结合算法
Hash划分算法

站点依赖算法

分片与复制算法

站点依赖与数据复制结合方法

Hash连接算法

比较

假定站点S1，S2分别有关系R1，R2的片段，每个片段的大小是R的一半（R/2）

站点依赖算法
- 无数据传递
- 可利用索引做本地连接
- 每个站点连接数据总量是R
分片和复制算法
- 数据传输总量是R
- 数据传送后，可能要重新创建索引
- 每个站点的连接数据量是(3/2)R，一个全关系和一个片断
Hash划分算法
- 数据传送量是R
- 索引可能无法使用（比片段复制算法效率更低）
- 每个站点的连接数据量同站点依赖

常用策略

两个关系在同一个站点
- R∞S，称外层关系为R，内层关系为S
- 嵌套循环法
  - 顺序扫描外层关系R，对于R的每一元组扫描内层关系S
  - 查找在连接属性上一致的元组，组合起来构成结果的一部分。
  - 需要扫描一次关系R和Card（R）次关系S。
- 排序扫描法
  - 先把两个关系按照连接属性进行排序
  - 然后按照连接属性值的顺序扫描这两个关系，使匹配的元组成为结果的一部分
  - 对两个关系都扫描一次，但增加了排序代价。
两个关系在不同一个站点，R（外层）和S（内层）
- 整体传输
  - 如果传输S，则需保存S（被多次扫描）。
  - 如果传输R，则S可直接使用一次到来的R元组，不保存R。
- 按需传输
  - 只传输需要连接的元组，一次一个元组，无需临时存储器。
  - 每次提取都要交换一次信息，传输代价高，只在高速局域网中才是合理的。
- 三种选择执行站点的方法
  - R站点
  - S站点
  - 其他站点
利用并行性的直接连接操作策略
- 通过重新分布元组实现操作内的并行，一般是不可行的，因为并行程度小，通信代价高。
- 多个操作间的并行是可行的
  - 流水线并行
    - 一个操作A的输出元组作为第二个操作B的输入。
    - 在第一个操作尚未产生全部的输出元组集合之前，第二个操作就可以在它的输入上进行工作。
    - 可以在不同的站点上运行A和B，在A产生部分结果元组的同时，B来使用它们。
  - 独立的并行
    - 查询表达式中相互之间没有依赖关系的操作可以并行执行。

Transactions

事务概念

事务是访问或更新各种数据项的最小逻辑工作单位
它是一个操作序列
它可以使数据库从一个一致状态到另外一个一致状态
事务必须保证数据库的一致性
事务执行期间数据库可能不一致
当事务提交时数据库必须是一致的

分布式事务

分布式事务是集中式事务的扩充
分布式事务（全局事务）是数据库的一个分布式操作序列，被操作的数据分布在不同的站点上，这些操作要么全做要么全不做，是一个不可分割的工作单位。
一个分布式事务由主事务（负责事务的开始、提交或异常终止）和多个子事务（局部事务，完成对数据的操作）组成。
全局事务，涉及多个站点
局部事务，仅涉及一个站点
站点和通信链路故障都可能导致错误发生

分布式事务的特性（ACID）

原子性(Atomicity)
一个事务要么全执行，要么全不执行，是不可分割的执行单位。
一致性(Consistency)
指数据应满足的约束条件。分布式事务的执行能使得分布式数据库从一个一致状态转变为另一个一致状态。
隔离性(Isolation)
事务更新过的数据在事务结束前对其他事务不可见。
持久性(Durability)
已完成事务对数据的更新应持久，发生故障后应不会丢失更新。

分布式事务的独特性

全局事务的主事务和子事务全部成功提交，才能改变数据库状态，有一个失败，其他子事务操作都要撤销。
还要考虑数据传送、通信原语和控制报文等。

结构

分布式事务的状态

活动（Active）：从事务开始执行的初始状态始，事务执行中保持该状态。
部分提交（Partially Committed）：事务的最后一个语句执行后进入该状态。
失败（Failed）：一旦发现事务不能正常执行时进入该状态。
夭折（Aborted）：当事务被回滚后，数据库恢复到事务开始执行前的状态。
提交（Committed）：当事务成功执行后的状态。

实现模型

进程模型

DBMS建立在操作系统之上；
DBMS在创建进程、进程通信、读写磁盘、分配内存时请求操作系统服务；
分布式事务中的子事务序列是以进程方式完成的。

进程

进程是程序运行的最小单位，也是资源分配的最小单位。
包含进程说明与进程执行两个方面。
具有并发性，不同于过程。

事务代理（Agent）

DDBMS中，各个站点上数据的操作是通过执行多个进程完成，这些进程称为分布式事务在执行站点上的“事务代理”。
事务代理是一个本地进程，代表应用执行对数据的操作。
代理可以执行应用程序员写的程序，也可以执行系统的原语函数。不同代理间通过报文实现通讯。
根代理（Root Agent）：应用启动站点上的代理。根代理所在的站点称作原发站点。
一般，根代理负责发系统原语，只有根代理可以请求创建新代理。

进程协作（代理协作）

为了协调执行分布式应用的全局操作，分驻于不同站点的诸事务代理必须进行协调，有如下规定：

每一应用都有一个负责启动整个事务的根代理（总代理）。
只有总代理才能发出全局有效的事务开始、提交和撤销原语。
只有总代理才能请求建立新的事务代理。
各站点上的子事务都执行成功，总代理才能决定提交该事务；否则总代理将决定撤销该事务。

分布式事务管理问题（特殊性）

多个副本间的一致性
在数据更新时，DDBMS负责保持多副本间数据的一致性。
站点故障
当站点发生故障时, DDBMS能够检测到站点故障。当故障站点恢复后,DDBMS协同该故障站点上的DBMS, 使它的局部数据库保持与其他站点同步。
通信网络故障
DDBMS应有能力处理通信网络故障：一般的通信故障和网络分割。
分布式提交
采用提交协议保证分布式事务的正确提交。

事务管理的任务

当多个事务并发执行和事务执行发生错误（故障）时，使数据库仍保持一致状态。

事务是一个一致计算与可靠计算的单位。

分布式事务管理的目标

维护分布式事务的原子性、一致性、持久性和隔离性。
获得最小的主存和CPU开销。
降低控制报文的传输个数和加快分布式事务的响应速度。
获得最大限度的系统可靠性和可用性。

抽象管理模型

DTM（Distributed Transaction Manager）功能
- 保证分布式事务的ACID特性；
- 提供对分布式事务的控制和正确执行，包括：
  - 分布式事务的开始、结束；
  - 子事务的分解；
  - 协调子事务的执行；
- 支持分布式事务执行的位置透明性，即将子事务分配到适当的站点上去执行。

控制模型

协调分布式事务中各成员DBMS执行其子事务的通用方法

主从控制模型
- 主、从控制器，LTM之间无通信
三角控制模型
- LTM之间可以传递数据，避免了主从之间不必要的传输
层次控制模型
- LTM还可再创建Agent，控制其它LTM执行，比前两种复杂

故障

站点故障
- 事务内部的故障
  - 非预期的、不正常的程序结束所造成的故障，如：
    - 计算溢出
    - 完整性破坏
    - 操作员干预
    - 输入输出错误
    - 并发事务的死锁等
- 系统故障
  - 造成系统停止运行的任何事件，要求系统重启动，如：
    - CPU出错
    - 缓冲区满
    - 系统崩溃
    - 停电等
- 介质故障
  - 磁盘损坏、磁头碰撞等，使数据库遭到破坏。
通讯故障
- 报文故障
  - 报文错
  - 报文失序
  - 报文丢失
  - 报文延迟
- 网络分割故障（网络断连）

故障处理难度

仅发生站点故障
站点故障与报文故障同时存在
站点故障、报文故障和网络分割故障同时存在

事务恢复

当发生故障时，保证事务原子性的措施称为事务故障恢复，简称事务恢复。
主要依靠日志来实现。

事务的提交点

当事务T在所有站点的数据库存取操作都已成功执行，并且所有操作对数据库的影响都已记录在日志中时，该事务T就到达提交点。
提交点后事务就成为已提交的事务，事务在日志中写入提交记录[commit,T]。
在系统发生故障时，扫描日志，检查提交记录，可以实现事务的恢复。
事务提交前强制写日志
在事务到达提交点以前，还未写入磁盘的日志的任何部分，必须被写入磁盘。
提交点是一个时间点，是可以提交事务的所有变化或者取消事务的时间点。
提交点对于数据库来说是个一致点。
提交点也是事务的重启点，可以安全地撤销事务。
提交点也是事务锁定资源的一个释放点。

日志

保存所有影响数据库项的值的事务操作的信息
用于故障恢复
记录的内容
- [start_transaction, T]
- [write_item, T, x, 旧值, 新值]
- [read_item, T, x]
- [commit, T]
- [abort, T]
- Log:记录长度以及其他用于恢复过程的辅助信息
日志本身存在一个优先保护的问题

检查点（Checkpoint）

设置一个周期性（时间/容量）操作点，表示此前已执行完的事务是正确的
写检查点的操作
- Log Buffer内容写入Log
- 写检查点Log信息：当前活动事务表，每个事务最近一次Log记录在Log文件中的位置
- DB Buffer内容写入DB
- 将本次检查点Log项在Log文件中的地址记入“重启文件”
遵循“先写日志”原则

事务恢复的原则

孤立和逐步退出事务的原则
- 对事务内部的故障，不影响其它事务，将事务回退（UNDO）即可。
成功结束事务原则
- 已提交的事务应该满足事务的持久性，发生故障后应该重做(REDO) 它所做过的所有修改数据库的操作。
夭折事务的原则
- 非局部的不可排除的故障，撤销全部事务，恢复到初态。
- 两种做法：
  - 利用数据备份恢复
  - 利用日志Undo

本地事务恢复

从“重启动文件”读出最近Checkpoint的地址，并定出Checkpoint在Log文件中的位置。
创建Redo表（空），Undo表（即Checkpoint相应内容中的活动事务表）。
前向检索Log，如果遇到Begin Transaction，则将对应事务记入到Undo表；如果遇到commit记录，则将对应的事务从Undo表移到Redo表。
反向检索Log，对Undo表中的事务，按照Log记录，做Undo操作，直到对应的Begin Transaction记录。
正向检索Log，对Redo表中的事务，按照Log记录，做Redo操作，直到对应的Commit记录。

分布式事务的恢复

由分布式事务管理器和局部事务管理器协同完成

分布式事务的撤消和提交

分布式事务的撤消：
- 由总代理生成一个AGENT执行ABORT命令，各个DTM向LTM发局部ABORT命令，撤消各个子事务。
分布式事务的提交：
- 由总代理生成一个AGENT执行COMMIT命令，各个DTM向LTM发局部COMMIT命令，提交各个子事务。
- 分布式事务的提交比较复杂，需要通过协议来保障，比如两阶段提交协议。

两阶段提交协议

基本思想

将本地原子性提交行为的效果扩展到分布式事务，只有所有参与执行分布式事务的站点都同意提交，才能提交。

提交过程

第一阶段：表决阶段
第二阶段：执行阶段

两类代理

协调者：掌握提交和撤销事务的决定权，一般是总代理。
参与者：负责在本地数据库中执行写操作，并且向协调者提出提交和撤销子事务的意向。

2PC协议的重要特点

允许参与者单方面撤销事务；
一旦参与者确定了提交或撤销协议，它就不能再更改它的提议；
当参与者处于就绪状态时，根据协调者发出的消息种类，它可以转换为提交状态或者撤销状态；
协调者根据全局提交规则做出全局终止决定；
协调者和参与者可能进入互相等待对方消息的状态，需要使用定时器，保证退出消息等待状态。

两阶段提交协议的通信结构

集中式
分层式
线性
分布式

站点故障

参与者将就绪信息(“Ready”)写入日志前故障
- 协调者等待超时，采取撤销决定，撤销其他子事务
- 故障站点重启后简单撤销该事务。
参与者将“Ready”信息写入日志后故障
- 其他站点正常结束该事务(Commit 或Abort)
- 故障站点重启后，由协调者提供相关信息，正确结束(Commit 或 Abort)。
协调者在发送“Prepare（准备）”信息后，写入“commit（提交）”/“abort（撤销）”记录前，发生故障
- 所有工作正常的参与者挂起
- 协调者从头开始恢复，重新发“Prepare”信息
协调者在写入“commit”/“abort”记录后，写入“Complete(end_of_trans)”之前，发生故障
- 需协调者重启时重新发决定信息，挂起的子事务继续提交，已提交子事务只发“ACK”信息。
协调者在写入“Complete”信息后发生故障
- 重启时不做任何动作

报文故障

第一阶段：
- 协调者的“Prepare”信息丢失
  没有收到“Prepare”信息的参与者等待，协调者也因等待超时，整个事务被撤销。
- 参与者的回答信息（“Ready/Abort”）丢失
  协调者等待超时，整个事务被撤销。
第二阶段：
- 协调者的“Commit/Abort”信息丢失
  参与者处于等待状态，可引入超时，请求再次发送。
- 参与者的“ACK”信息丢失
  协调者等待，可引入超时，再次发送相关命令。

网络分割故障

协调者子网：
- 在同一子网的参与者，可以正常结束。
- 协调者收不到其它参与者的信息，按参与者故障处理。
参与者子网：
- 参与者收不到协调者的信息，按协调者故障处理。

性能

简单，完全同步
具备紧密一致性
- 任何时刻的数据一致性和全局事务的原子性
全局事务可用性低
系统效率比较低

数据更新

主文本更新法
- 指定一个文本为主文本，其他的为辅文本
- 数据的更新面向主文本
- 主文本站点负责辅文本的更新
- 主文本更新法的问题
  - 更新传播必须在短时间内完成，否则可能产生“过时”数据
  - 主文本站点不可用时，其他辅文本站点也不可用
移动主文本法
- 若初次更新在辅文本上，把更新引向该数据的主站点；如果主站点此时尚未连通，则另选一个辅站点中的辅文本为该数据新的主文本进行更新；待原主文本站点连通后，系统自动把它改为辅文本，并按记录要求执行更新。
- 如果初次更新在主文本上，但主文本站点与网络未接通，则此次更新操作失败，事务被撤销。
- 移动文本法的问题
  - 网络分割成很多部分时，更新处理会不一致

Concurrency

并发控制就是负责正确协调并发事务的执行，保证并发的存取操作不至于破坏数据库的完整性和一致性，确保并发执行的多个事务能够正确地运行并获得正确的结果。

调度

指事务处理执行的一个操作序列
事务的操作分为两类：Ri(x)、Wi(x)
一组事务的调度必须包含这些事务的所有操作，且操作顺序与原事务相同
调度的操作之间可能存在冲突
- 读-写冲突
- 写-写冲突

串行调度

一个事务的第一个动作是在另一个事务的最后一个动作完成后开始。即调度中事务的各个操作不会交叉，每个事务相继执行。
串行调度总是可以正确执行，但是串行调度效率低。

一致性调度

如果调度可以使得数据库从一个一致性状态转变为另一个一致性状态，则称该调度为一致性调度。
串行调度总可以使数据库保持一致，属于一致性调度。
一致性调度不一定是可串行化调度
同一事务集上的可串行化调度，结果未必相同

调度等价（冲突等价）

不同调度S1和S2是等价的，其充分条件是：对任意一对冲突操作< Oi, Oj >，在调度S1中Oi优先Oj而在调度S2中Oi也优先Oj。

冲突操作

两个对同一数据项进行的操作中，有一个写操作，两者即为冲突操作。

可串行化调度

如果一个调度等价于串行调度，则该调度称为可串行化调度。
可串行化调度可以通过一系列非冲突操作的交换，调整为串行调度。

并发调度

一组并发执行的事务的调度序列。
必须保证每一事务内部的操作的顺序。
冲突操作必须先后依次执行。

分布式事务可串行化调度测试

可串行理论可以直接扩展到无重复副本的分布式数据库中。
- 事务在每个站点上的执行调度称作局部调度。
- 如果在无重复副本的分布式数据库中，每个局部调度都是可串行化的，则它们的并（全局调度）也是可串行化的。
在有副本的情况下，可能局部调度是可串行化的，但全局调度不是可串行化的。

数据副本情况

采用单副本可串行化调度，维持数据副本的相互一致性，此时要求：
- 每一个局部调度必须是可串行化的。
- 局部调度中的冲突操作必须具有相同的相对顺序（保证冲突事务的串行顺序是相同的）。
采用ROWA协议，读一个/写全部。
实际上难以实现同时写全部的操作。
有副本的情况下需要附加额外的副本控制协议。

并发控制

一般不测试调度是否可串行化，而是使用规则或协议保证产生一个可串行化的调度。
通过调度的可串行化来保证调度的正确性。

方法

基于封锁的方法

锁定数据项以防止其他事务并发访问。

基于时间戳的方法

给事务分配时间戳，根据时间戳顺序来执行事务。

悲观算法

提前考虑和解决冲突。

乐观算法

认为冲突一般不会发生，发生后再处理。

基于封锁