关系数据理论 Flashcards
关系
把关系模式看作是一个三元组:R。
当且仅当U上的一个关系r满足F时,r称为关系模式R的一个关系。
关系数据库逻辑设计问题
针对一个具体问题,应该如何构造一个适合于它的数据模式,即应该构造几个关系模式,每个关系由哪些属性组成等。
第一范式(1NF)
一个关系模式R的所有属性都是不可分割的基本数据项。
第一范式是对关系模式最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。
数据依赖(非形式的概念)
一个关系内部属性与属性之间的一种约束关系。通过属性间值的相等与否体现出来的数据间相关联系。是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。
最重要的数据依赖
函数依赖(FD),多值依赖(MVD)。
关系模式存在的问题
1。数据冗余太大。(系主任姓名重复出现)
2。更新异常。由于数据冗余,当更新数据库中的数据时,系统要付出很大的代价来维护数据库的完整性,否则会面临数据不一致的危险。(某系更换系主任后,必须修改与该系学生有关的每一个元组)
3。插入异常。(如果一个系刚成立,尚无学生,就无法把这个系及其系主任的信息存入数据库)
4。删除异常。(如果某个系的学生全部毕业了,在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了)
一个"好"的模式应当不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少。
函数依赖
设R(U)是属性集U上的关系模式。X,Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数确定Y或Y函数依赖于X,记作X->Y。
函数依赖是最基本的一种数据依赖,也是最为重要的一种数据依赖。
函数依赖是属性之间的一种联系,体现在属性值是否相等上。由定义可知,如果X->Y,则r中的任意两个元组若其在X上的属性值相同,那么在Y上的属性值也一定相同。
函数依赖和别的依赖一样是语义范畴的概念,反映(描述)了现实世界的一种语义。要从属性之间实际存在的语义来确定它们之间的函数依赖。
函数依赖不是指关系模式R的某个或某些关系满足的约束条件,而是指R的一切关系均要满足的约束条件。函数依赖不是指关系模式R在某个时刻的关系(值)所满足的约束条件,而是指R在任何时刻的一切关系均要满足的约束条件。
非平凡的函数依赖
(在笔记本上)
平凡的函数依赖
(在笔记本上)
决定属性组(决定因素)
若X->Y,则X称为这个函数依赖的决定属性组,也称为决定因素。
不函数依赖
(在笔记本上)
完全函数依赖
(在笔记本上)
部分函数依赖
(在笔记本上)
传递函数依赖
(在笔记本上)
直接函数依赖
(在笔记本上)
候选码
(在笔记本上)
若关系中的某一属性值能唯一地标识一个元组,则称该属性组为候选码。
主码
若候选码多于一个,则选定其中的一个为主码。
主属性
包含在任何一个候选码中的属性。
非主属性(非码属性)
不包含在任何码中的属性。
全码
最简单的情况,单个属性是码。
最极端的情况,整个属性组是码,称为全码。
外码
关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码,也称外码。
主码与外部码提供了一个表示关系间联系的手段。
范式
符合某一种级别的关系模式的集合。
关系数据库中的关系是要满足一定要求的,满足不同程度要求的为不同范式。满足最低要求的叫第一范式,简称1NF。在第一范式中满足进一步要求的为第二范式,其余以此类推。
1971-1972 : E.F.Codd系统地提出了1NF、2NF、3NF的概念,讨论了规范化问题。
1974 : E.F.Codd和Boyce共同提出BCNF。
1976 : Fagin提出4NF。
后来又有人提出5NF。
各种范式之间的联系
(在笔记本上)
规范化
一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化。