互联网数据库自考复习资料(17页).doc
《互联网数据库自考复习资料(17页).doc》由会员分享,可在线阅读,更多相关《互联网数据库自考复习资料(17页).doc(17页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、-5. 数据库管理阶段:(1)数据结构化。(2)数据共享性高、冗余度小、易扩充。(3)数据独立性高。(4)统一的数据管理和控制:数据的安全性保护、数据的完整性控制、数据库恢复和并发控制。(5)数据的最小存取单位是数据项。1. 人工管理阶段数据管理的特点:(1) 数据不保存在机器中(2) 无专用的软件对数据进行管理(3) 只有程序的概念,没有文件的概念(4) 数据面向程序2. 文件系统阶段数据管理的特点:(1) 数据可长期保存在外存的磁盘上(2) 数据的逻辑结构和物理结构有了区别(3) 文件组织已呈多样化。有索引、链接和散列文件(4) 数据不再属于某个特定的程序,可重复使用。3. 文件系统显露出
2、三个缺陷:(1) 数据冗余性(2) 数据不一致性(3) 弱4. 数据库阶段的管理方式具有以下特点:(1) 采用复杂的数据模型表示数据结构(2) 有较高的数据独立性(3) 数据库系统为用户提供方便的用户接口(4) 系统提供四方面的数据控制功能(5) 对数据的操作既可以以记录为单位,又可以以数据项为单位5. 数据描述三个领域之间的关系:从事物的特性到计算机中的数据表示,经历了三个领域:现实世界、信息世界、机器世界。(1) 现实世界:存在于人们头脑之外的客观世界,称为现实世界。(2) 信息世界:是现实世界在人们头脑中的反映。(3) 机器世界:信息世界的信息在机器世界中以数据形式存储。信息世界中数据描
3、述的术语有:实体、实体集、属性、实体标识符机器世界中数据描述的术语有:字段、记录、文件、关键码它们的对应关系是:在数据库中每个概念都有类型和值之区分,类型是概念的内涵,值是概念的外延6. 数数据描述的两种形式:数据描述有物理描述和逻辑描述两种形式。物理数据描述指数据在存储设备上的存储方式,物理数据是实际存放在存储设备上的数据。逻辑数据描述指程序员或用户用以操作的数据形式,是抽象的概念化数据。数据管理软件的功能之一,就是要把逻辑数据转换成物理数据,以及把物理数据转换成逻辑数据。8. 数据模型的种类:目前广泛使用的数据模型可分为两种类型:概念数据模型、结构数据模型概念数据模型:是独立于计算机系统的
4、模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构;它是现实世界的第一层抽象,是用户和数据库设计人员之间进行交流的工具;这一类中著名的模型是“实体联系模型”,简称“ER”模型。结构数据模型:是直接面向数据库的逻辑结构;它是现实世界的第二层抽象,涉及到计算机系统和数据库管理系统; 这一类中的例子有层次、网状、关系、面向对象等模型。数据模型数据模型是现实世界数据特征的抽象。是数据库系统的核心和基础。 数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。根据模型应用目的分为:概念模型,也称信息模型,它是按用户的观点对数据和信息
5、建模。数据模型,主要包括层次模型、网状模型、 关系模型和面向对象数据模型,它是按计算机系统的观点对数据建模。数据模型三个要素: 数据结构 描述系统的静态特性数据操作 描述系统的动态特性数据的约束条件 是一组完整性规则的集合数据模型: 层次模型、网状模型、关系模型和面向对象数据模型。其中层次模型和网状模型统称为非关系模型。层次模型:用树型结构表示实体间联系的数据模型层次模型有以下两个限制:只有一个结点没有双亲结点,称之为根结点;根以外的其他结点有且只有一个双亲结点。层次数据模型可以直接表示一对多(包括一对一)的联系;层次模型表示多对多联系,必须首先将其分解成一对多联系。分解方法有两种:冗余结点法
6、和虚拟结点法。网状模型:用有向图结构表示实体类型及实体间联系的数据模型。(1)允许一个以上的结点无双亲;(2)一个结点可以有多于一个的双亲。关系模型:是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外键表示实体间联系。关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。概念模型数据描述的三个领域:现实世界、信息世界和机器世界数据描述的两种形式:物理描述和逻辑描述。前者是指数据在存储设备上的存取方式,后者是指程序员或用户以用以操作的数据形式。两个实体型之间
7、的联系可以分为三类:一对一联系(11);一对多联系(1n);多对多联系(mn)E-R图提供了表示实体型、属性和联系的方法。实体-联系方法(E-R方法)是抽象和描述现实世界的有力工具。 实体型:用矩形表示,矩形框内写明实体名。 属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。 联系:用菱形表示,菱形框内写明联系名,并用无向边分别志有关实体连接起来,同时在无向边旁标上联系的类型(11,1n或m n)。9. 结构数据模型的三个组成部分:数据结构、数据操作、数据完整性约束是结构数据模型的三个组成部分。数据结构:是指对实体类型和实体间联系的表达和实现数据操作:是指对数据库的检索和更新(插、删、改
8、)两类操作的实现数据完整性约束:给出数据及其联系应具有的制约和依赖规则。10. 层次模型的特点:用树型结构表示实体类型及实体间联系的数据模型称为层次模型。层次模型的特点是:记录之间的联系通过指针实现,查询效率较高。缺点是:(1)只能表示1:N联系(2)由于树型结构层次顺序的严格复杂,引起数据的查询和更新操作也很复杂,因此编写应用程序也很复杂。11. 网状模型的特点:用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。 网状模型的特点是:记录之间联系通过指针实现,M:N联系也容易实现,查询效率较高。 缺点是:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。12. 的特点:的主要特征
9、是用二维表格结构表达实体集,用外键表示实体间联系。特点是:与层次、网状的最大差别是用关键码而不是用指针导航数据,表格简单,用户易懂,编程时不涉及存储结构、访问技术等细节。13. 数据库体系结构中的三级结构、两级映象:数据库的体系结构分为三级:内部级、概念级、外部级。外部级:最接近用户,是单个用户所能看到的数据特性。单个用户使用的数据视图的描述称为“外模式”。概念级:涉及到所有用户的数据定义,是全局的数据视图。全局数据视图的描述称为“概念模式”。内部级:最接于物理存储设备,涉及到实际数据存储的结构。物理存储数据视图的描述称为“内模式”。为实现这三个抽象级别的联系和转换,DBMS在级级结构之间提供
10、两个层次的映象:外模式/模式映象,模式/内模式映象。两级映象: 外模式/模式映象 一般在外模式中描述。 模式/内模式映象 一般在内模式中描述。 两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。14. 二级数据独立性:数据独立性是指:应用程序和数据之间相互独立,不受影响。分为物理独立性和逻辑独立性。(1) 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对内模式的修改尽量不影响概念模式。(2) 逻辑数据独立性:如果数据库的概念模式要进行修改,如增加记录类型或增加数据项
11、,那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。也就是概念模式的修改尽量不影响外模式和应用程序。15. DBMS的主要功能:(1) 数据库的定义功能:DBMS提供数据定义语言(DDL)定义数据库的三级结构及其相互之间的映象、完整性、安全控制等约束。(2) 数据库的操纵功能:DBMS提供数据操纵语言(DML)实现对数据库中数据的操作。(3) 数据库的保护功能:DBMS对数据库的保护主要通过数据库的恢复、数据库的并发控制、数据库的完整性控制、数据库的安全性控制等四个方面实现。(4) 数据库的存储管理:DBMS的存储管理子系统提供了数据库中数据和应用程序的一个界面,其职责是把各种D
12、ML语句转换成低层的文件系统命令,起到数据的存储、检索和更新的作用。(5) 数据库的维护功能:DBMS中实现功能的实用程序主要有数据装载程序、备份程序、文件重组织程序、性能监控程序。(6) 数据字典(DD):数据库系统中存放三级结构定义的数据库称为数据字典,对数据库的操作都要通过访问DD才能实现。16. DBMS的组成:DBMS是由两大部分组成:查询处理器和存储管理器。(1) 查询处理器有四个主要成分:DDL编译器、DML编译器、嵌入型DML的预编译器、查询运行核心程序。(2) 存储管理器有四个主要成分:授权和完整性管理器、事务管理器、文件管理器、缓冲区管理器。17. DBS的组成: DBS:
13、数据库系统(Database System),DBS是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。DBS是一个实际可运行的,按照数据库方法存储、维护和向应用系统提供数据支持的系统,它是数据库、硬件、软件、数据库管理员(DBA)的集合体。(1) 数据库(DB):是与一个特定组织各项应用有关的全部数据的集合,由应用数据的集合(物理数据库)、关于各级数据结构的描述(描述数据库)两部分组成。(2) 硬件:包括中央处理机、内存、输入输出设备、数据通道等硬件设备。(3) 软件:包括DBMS、OS、各种宿主语言和应用开发支持软件
14、等程序。(4) DBA:DBA是控制数据整体结构的人,负责DBS的正常运行。18. DBS的全局结构:(1) 数据库用户。可分为四类:DBA、专业用户、应用程序员、终端用户(2) DBMS的查询处理器。包括四部分:DML编译器、嵌入型DML的预编译器、DLL编译器、查询运行核心程序。(3) DBMS的存储管理器。包括四部分:授权和完整性管理器、事务管理器、文件管理器、缓冲区管理器。(4) 磁盘存储器中的数据结构。包括四种形式:数据文件、数据字典、索引文件、统计数据组织。DBMS:数据库管理系统(Database Management System),DBMS是位于用户与操作系统之间的一层数据管
15、理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。数据库技术:是一门研究数据库结构、存储、管理和使用的软件学科。第一代数据库系统,即层次数据库系统和网状数据库系统第二代数据库系统,即关系数据库系统第三代数据库系统,即面向对象数据库系统 数据库学科的研究范围:数据库管理系统软件的研制; 数据库设计; 数据库理论数据系统的三级模式结构:外模式(物理模式)、模式(逻辑模式)和内模式数据库管理系统的功能: 数据定义数据操纵数据库运行管理数据组织、存储和管理数据库的建立和维护数据通信接口
16、数据库管理系统组成:数据定义语言及其翻译处理程序 数据操纵语言及其编译(或解释)程序数据库运行控制程序实用程序一个设计优良的DBMS友好的用户界面比较完备的功能较高的运行效率清晰的系统结构和开放性第二章关系数据库系统与非关系数据库系统的区别是,关系系统只有表这一种数据结构;而非关系数据库系统还有其他数据结构,对这些数据结构有其他的操作。关系模型的组成:关系数据结构、关系操作集合、关系完整性约束关系数据语言关系代数语言 例如ISBL元组关系演算语言 例如ALPHA,QUEL 关系演算语言域关系演算语言 例如QBE具有关系代数和关系演算双重特点的语言 例如SQL关系的三类完整性约束:实体完整性、参
17、照完整性和用户定义的完整性实体完整性规则:要求关系中组成主键的属性上不能有空值。 参照完整性规则:要求不引用不存在的实体。 用户定义完整性规则:由具体应用环境决定,系统提供定义和检验这类完整性的机制。 关系数据语言的共同特点是:语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。基本关系具有以下六条性质:列是同质的(Homogeneous),即每一列中的分量同一类型的数据,来自同一个域。不同的列可出自同一个域,称其中的每列为一个属性,不同的属性要给予不同的属性名。列的顺序无所谓,即列的次序可以任意交换。任意两个元组不能完全相同。行的顺序无所谓,即行的次序可以任意交
18、换。分量必须取原子值,即每一个分量都必须是不可分的数据项。 关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件。这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。 关系是关系模式在某一个时刻的状态或内容。关系模式是静态的,稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。但在实际当中,人们常常把关系模式和关系都称为关系。实体完整性规则说明如下:(1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。例如学生关系对应于学生的集合。(2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。(3)
19、相应地,关系模型中以主码作为唯一性标识。(4)主码中的属性即主属性不能取空值。所谓空值就是不知道或无意义的值。关系可以有三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表元组变量主要有两方面的用途:简化关系名。操作条件中使用量词时必须用元组变量。第三章SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体。特点包括:综合统一、高度非过程化、面向集合的操作方式、以同一种语法结构提供两种使用方式、语言简洁,易学易用。定义和合理地使用视图能带来的好处为:、视图能够简化用户的操作 、视图使用户能以多种角度看待同一数据 、视图对重构数据库提供了一定程度的逻辑独立性、视图能够对机密数据提供
20、安全保护视图更新操作规则的限制: 如果视图是从多个基本表使用联接操作导出的,则不允许更新。 如果导出的视图使用了分组和聚合操作,也不允许更新。 如果视图是从单个基本表使用选择和投影操作导出的,并且包括了基本表的主键或某个候选键,则可以执行操作。SQL中数据控制功能包括事务管理功能和数据保护功能,即数据库的恢复、并发控制;数据库的安全性和完整性。第四章数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。现在人们已经提出了许多种类型的数据依赖,其中最重要的是函数依赖和多值依赖。关系模式规范化时一般应遵循以下原则:(1
21、)关系模式进行无损连接分解。(2)合理选择规范化程度。(3)正确性与可实现性原则。关系模式规范化的基本步骤如图所示。对1NF关系进行投影,消除原关系中非主属性对码的函数依赖,将1NF关系转换为若干个2NF关系。 对2NF关系进行投影,消除原关系中非主属性对码的传递函数依赖,从而产生一组3NF关系。对3NF关系进行投影,消除原关系中主属性对码的部分函数依赖和传递函数依赖(也就是说,使决定属性都成为投影的候选码),得到一组BCNF关系。消除决定属性集非码的非平凡函数依赖 1NF消除非主属性对码的部分函数依赖 2NF消除非主属性对码的传递函数依赖 3NF消除主属性对码的部分和传递函数依赖 BCNF消
22、除非平凡且非函数依赖的多值依赖 4NF消除不是由候选码所蕴含的连接依赖 5NF以上三步也可以合并为一步:对原关系进行投影,消除决定属性不是候选码的任何函数依赖。 对BCNF关系进行投影,消除原关系中非平凡且非函数依赖的多值依赖,从而产生一组4NF关系。对4NF关系进行投影,消除原关系中不是由候选码所蕴含的连接依赖,即可得到一组5NF关系。 5NF是最终范式。1NF/2NF/3NF存在的问题: 插入异常 删除异常 数据冗余度大 修改复杂BCNF问题:数据冗余度大 增加操作复杂 删除操作复杂 修改操作复杂 关系模式分解的三个定义(判断对关系模式的一个分解是否与原关系模式等价可以有三种不同的标准):
23、 (1)分解具有无损连接性。(2)分解要保持函数依赖。(3)分解既要保持函数依赖,又要具有无损连接性。规范化理论提供了一套完整的模式分解算法,按照这套算法可以做到:若要求分解具有无损连接性,那么模式分解一定能够达到4NF。若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF。若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNFBCNF的关系模式都具有如下3个性质: 所有非主属性都完全函数依赖于每个候选码。所有主属性都完全函数依赖于每个不包含它的候选码。没有任何属性完全函数依赖于非码的任何一组属性。第五章数据库的被破坏主要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 互联网 数据库 自考 复习资料 17
限制150内