软考数据库系统工程师复习资料41980.docx
《软考数据库系统工程师复习资料41980.docx》由会员分享,可在线阅读,更多相关《软考数据库系统工程师复习资料41980.docx(50页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、软考数据库系统工程师复习资料一、数据模型1.数据模型的三要素(1)数据结构 数据结构是所研究的对象类型(Object Type)的集合。这些对象和对象类型是数据库的组成成分。一般可分为两类:一类是与数据类型、内容和其它性质有关的对象;一类是与数据之间的联系有关的对象。前者如网状模型中的数据项和记录,关系模型中的域、属性和关系等。后者如网状模型中的关系模型(set type)。在数据库领域中,通常按照数据结构的类型来命名数据模型,进而对数据库管理系统进行分类。如层次结构、网状结构和关系结构的数据模型分别称作为层次模型、网状模型和关系模型。相应地,数据库分别称作为层次数据库、网状数据库和关系数据库
2、。(2)数据操作 数据操作是指对各种对象类型的实例(或值)所允许执行的操作的集合,包括操作及有关的操作规则。在数据库中,主要的操作有检索和更新(包括插入、删除、修改)两大类。数据模型定义了这些操作的定义、语法(即使用这些操作时所用的语言)。数据结构是对系统静态特性的描述,而数据操作是对系统动态特性的描述。两者既有联系,又有区别。(3)数据的约约束条件 数据的约束束条件是完整整性规则的集集合。完整性性规则是指在在给定的数据据模型中,数数据及其联系系所具有的制制约条件和依依存条件,用用以限制符合合数据模型的的数据库的状状态以及状态态的变化,确确保数据的正正确性、有效效性和一致性性。2.概念模型数数
3、据模型是数数据库系统的的核心和基础础。每个DBBMS软件都都是基于某种种数据模型的的。为了把现现实世界中的的具体事物或或事物之间的的联系表示成成DBMS所支支持的数据模模型,人们首首先必须将现现实世界的事事物及其之间间的联系进行行抽象,转换换为信息世界界的概念模型型;然后将信息息世界的概念念模型转换为为机器世界的的数据模型。也也就是说,首首先把现实世世界中的客观观对象抽象成成一种信息结结构。这种信信息结构并不不依赖于具体体的计算机系系统和DBMMS。然后,再再把概念模型型转换为某一一计算机系统统上某一DBBMS所支持持的数据模型型。因此,概概念模型是从从现实世界到到机器世界的的一个中间层层次。
4、现实世世界的事物反反映到人的大大脑之中,然然后人们开始始认识这些事事物,经过选选择、命名、分分类和组织等等抽象工作之之后形成概念念模型,并进进入到信息世世界。?用户(useer) 关心的是现现实世界中的的事物、事物物的属性及其其相互关系。例例如,用户可可能关心他的的顾客及其属属性,如顾客客地址、银行行帐号等等。用用户也关心自自己的定货帐帐目,如谁订订的货、订的的什么和订多多少等等。?系统分析员员(anallyst) 同样也关心心现实世界,但但是系统分析析员需要分析析用户的信息息需求。作为为需求分析的的结果,分析析员必须以文文档的形式对对需求进行结结构化的描述述;这个文档就就是信息模型型。?实体
5、(Enttity) 实体是构成成数据库的基基本元素。实实体是指一个个存在的东西西以区别这个个东西所具有有的属性和这这个东西与其其它东西的联联系。实体可可以是人,也也可以是物;可以是实际际对象,也可可以是概念;可以是事物物本身,也可可以是指事物物之间的联系系。?属性(Atttributte) 一个实体可可以由若干个个属性来刻画画。属性是相相对实体而言言的,是实体体所具有的特特性。?关键字(Keey) 能唯一地标标识实体的属属性的集合称称为关键字(或或码)。?域(Domaain) 属性的取值值范围称作域域。?实体型(Enntity Type) 一类实体所所具有的共同同特征或属性性的集合称为为实体型
6、。一一般用实体名名及其属性来来抽象地刻画画一类实体的的实体型。?实体集(Enntity Set) 同型实体的的集合叫实体体集。例如,学学生就是一个个实体集。实实体集的名即即是实体型。对对于学生和(学学号,姓名,年年龄,系,年年级)均是实实体型,而学学生是对实体体型(学号,姓姓名,年龄,系系,年级)所所起的名称,两两者是指同一一客观对象。但但本科生和研研究生可以为为相同实体型型,而实体集集不同。?联系(Rellationnship) 现实世界的的事物之间是是有联系的。一一般存在两类类联系:一是实体内内部的组成实实体的属性之之间的联系,二二是实体之间间的联系。在在考虑实体内内部的联系时时,是把属性
7、性看作为实体体。一般来说说,两个实体体之间的联系系可分为三种种:(1)一对一(111)联系 若对于实体体集A中的每一个个实体,实体体集B中至多有唯唯一的一个实实体与之联系系,反之亦然然,则称实体体集A与实体集B具有一对一一联系,记作作11。(2)一对多(11n)联系 若对于实体体集A中的每个实实体,实体集集B中有n个实体(n0)与之联联系;反之,对于于实体集B中的每一个个实体,实体体集A中至多只有有一个实体与与之联系,则则称实体集AA与实体集B有一对多联联系,记为11n。相应地有有多对一(nn1)联系 多对一联系系,从本质上上说,是一对对多联系的逆逆转。其定义义同一对多联联系类似,不不再赘述。
8、(3)多对多(mmn)联系 若对于实体体集A中的每一个个实体,实体体集B中有n个实体(n0)与之联联系;反之,对于于实体集B中的每一个个实体,实体体集A中也有m个实体(m0)与之对对应,则称实实体集A与实体集B具有多对多多联系,记作作mn。实质上,多多对多联系是是任意一种联联系。另外,同同一实体集内内的各个实体体间也可以有有各种联系。概概念模型的表表示方法最常常用的是实体体一联系方法法(Entiity-Reelatioonshipp Apprroach),简简称E-R方法。该该方法是由PP.P.S.Chen在在1976年提提出的。E-R方法用E-RR图来描述某某一组织的概概念模型。在在这里仅介
9、绍绍E-R图的要要点。在E-R图中:(1)长方形框框表示实体集集,框内写上上实体型的名名称。(2)用椭圆框框表示实体的的属性,并用用有向边把实实体框及其属属性框连接起起来。(3)用菱形框框表示实体间间的联系,框框内写上联系系名,用无向向边把菱形框框及其有关的的实体框连接接起来,在旁旁边标明联系系的种类。如如果联系也具具有属性,则则把属性框和和菱形框也用用无向边连接接上。3.三种主要的的数据模型实实际DBMSS所支持的数数据模型主要要有三种:?层次模型(HHierarrchicaal Moddel)?网状模型(NNetworrk Moddel)?关系模型(RRelatiional Modell)
10、其中,关关系模型是当当前DBMSS所支持的数数据模型的主主流。90年代运行行的DBMSS几乎都是基基于关系模型型的。层次模模型和网状模模型统称为非非关系模型。非非关系模型的的结构可以和和图论中的图图相对应,比比较直观,但但在理论上不不完备,实现现效率较低,故故此目前很少少用。但是最最近,层次模模型在研究面面向对象的DDBMS中已已得到重视。在在关系模型中中,数据在用用户的观点中中(或在用户户视图中)的的逻辑结构是是一张二维表表(Tablle)。?关系(Rellationn),对应于于平常讲的一一张表。?元组(Tupple),表表中的一行。?属性(Attribute),表中的一列称为一个属性,给
11、每一列起一个名,称为属性名。这一列或这个属性所有可能取的值的集合称为这个属性的值域(Domain),值域中的一个元素叫做这个属性的值。?主关键字(Primary Key Attribute或Primary Key),是指能唯一标识一个元组的一个或一组属性。?分量(Attribute value),是指元组中的一个属性值。?关系模式(Relational Schema),是对关系的描述,一般用关系名(属性名1,属性名2,属性名n)来表示。同层次模型和网状模型相比较,关系模型具有下列特点:(1)概念单一 在关系模型中,无论是实体还是实体之间的联系都用关系来表示。在关系模型中,在用户的观点中,数据的
12、逻辑结构就是表,也只有这唯一的概念。在非关系模型中,用户要区分记录型与记录型之间的联系两个概念;当环境复杂时,数据结构异常复杂,难以掌握。而关系模型,由于概念单一,可以变复杂为直观、简单,易学易用。(2)规范化 所谓关系规范化是指在关系模型中,每一个关系都要满足一定的条件要求。这些条件被称为规范条件。对于关系,一个最基本的规范条件是,要求关系中的每一个属性(或分量)均是不可分的数据项;也就是说不允许表中有表,表是不可嵌套的。(3)在关系模型中,用户对数据的操作的输入和输出都是表,也就是说,用户通过操作旧表而得到一张新表。总之,关系模型概念简单,结构清晰,用户易学易用,有严格的以数学为基础的关系
13、理论作指导,便于DBMS的实现。基于关系的DBMS简化了应用程序员的工作,便于数据库应用系统的设计和维护。故此,关系模型自诞生以后就得到了迅速的发展,成为应用最为广泛的、唯一的数据模型。二、数据库系统统的结构1.数据库系统统的三级模式式结构数据库库管理系统的的三级模式结结构由外模式式、模式和内内模式组成。外外模式(exxternaal schhema),或或子模式(ssubschhema)或或用户模式(user schema),是指数据库用户所看到的数据结构,是用户看到的数据视图。模式(schema)或逻辑模式(logic schema),是数据库中对全体数据的逻辑结构和特性的描述,是所有用户
14、所见到的数据视图的总和。外模式是模式的一部分。内模式(internal schema),或存储模式(storage schema),或物理模式(physical schema),是指数据在数据库系统内的存储介质上的表示,即对数据的物理结构和存取方式的描述。模式描述的是数据的全局的逻辑结构,决定了DBMS的功能。外模式涉及的仅是局部的逻辑结构,是模式的子集,是对模式的调用。数据库系统的三级模式是对数据进行三个层次抽象的工具。通过三级模式,把对数据的具体组织留给DBMS来完成,使得用户能在高层次上处理数据的逻辑结构,而不必关心数据的物理结构。为了实现这三个层次这间的联系,DBMS在沟通三级模式中提
15、供了两个映象:外模式-模式映象模式-内模式映象(1)模式 模式规定了数据库中全部数据的一个逻辑表示或描述形式。模式既不同于内模式,也不同于外模式。它比内模式抽象,不涉及数据的物理结构和存储介质。它与具体的应用程序或高级语言无关。(2)外模式 外模式是个别用户的数据视图,即与某一应用有关的数据的逻辑表示。(3)内模式 内模式是全部数据库的内部表示或底层描述,是用来定义数据的物理结构和存取方式的。(4)二级映象 对于同一个模式,可以有任意多个外模式。外模式-模式的映象定义了某个外模式和模式之间的对应关系。这些映象的定义通常包含在各自的外模式中。当模式改变时,外模式-模式的映象要做相应的改变,以保证
16、外模式的不变性。这是数据库管理员(DBA)的责任。模式-内模式的映象定义了数据逻辑结构和存储结构之间的对应关系。例如,字段的内部表示等。当数据库的存储结构改变时,模式-内模式的映象也须做相应的修改,以使得模式保持不变性。这仍是DBA的责任。正是由于上述二级映象的功能及其自动实现,使得数据库系统中的数据具有较高的逻辑独立性和物理独立性,从而大大地方便了用户的使用。(5)概念模式与模式ANSI研究组于1975年2月提出一个临时报告。1978年提出一个最终报告,称之为ANSI/SPARC报告,简称为SPARC报告。SPARC报告中指出,数据库管理系统应具有三级模式的结构,即概念模式、外模式和内模式。
17、其中外模式和内模多与上面所讲的大致相当。但SPARC报告中的概念模式是指一个组织或部门所对应的现实世界的真实模型,即概念模型。概念模式仅描述实体及其属性和联系,不涉及机器世界的概念。概念模型是信息世界范畴内的信息的结构,而模式是机器世界范畴内的概念模型的逻辑表示。概念模型独立于具体的计算机系统,甚至是和计算机无关的,是一个组织或部门的模型。常用的描述概念模式的方法是E-R方法。模式是依赖于具体的计算机及其DBMS的。模式通过三种具体模型:层次模型、网状模型和关系模型来加以实现。概念模式必须转换成具体的数据模型,然后才能在相应的DBMS上实现。概念模型和模式都是描述信息或数据的整体结构的,然而它
18、们是在不同的抽象层次上加以描述的。概念模型离机器更远,形式化程度低。从远离机器的观点看,概念模型更抽象些,但更接近现实世界。而模式描述使用的是形式化的语言-模式DDL,而概念模型描述使用的是E-R图和一些自然语言。2.使用数据库库的计算机系系统结构广义义地讲,实际际上使用数据据库的计算机机系统由下列列几个部分组组成的:(1)硬件部分分 包括主机、外外部存储设备备、网络设备备和电源等。(2)软件部分 包括操作系统、DBMS、编译系统和应用开发工具软件等。(3)人员 包括数据库管理员(Data Base Administrator-DBA),系统分析员(System Analyst)、应用程序员(
19、Application Programmer)和用户(User)。3.数据库管理理系统数据库库管理系统DDBMS是数数据库系统的的核心。DBBMS是负责责数据库的建建立、使用和和维护的软件件。DBMSS建立在操作作系统之上,实实施对数据库库的统一管理理和控制。用用户使用的各各种数据库命命令以及应用用程序的执行行,最终都必必须通过DBBMS。另外外,DBMSS还承担着数数据库的安全全保护工作,按按照DBA所规定定的要求,保保证数据库的的完整性和安安全性。DBBMS的主要要功能包括以以下几个主要要方面:(1)数据库的的定义功能 DBMS通通过提供数据据描述语言(也也称数据定义义语言)(DData
20、DDescriiptivve LannguageeDDDL)来对外外模式、模式式和内模式加加以描述。然然后模式翻译译程序把用DDDL写的各各种模式的定定义源码翻译译成相应的内内部表示,形形成相应的目目标形式,分分别叫目标外外模式、目标标模式、目标标内模式,这这些目标模式式是对数据库库的描述,而而不是数据本本身。(目标标)模式只刻刻画了数据库库的形式或框框架,而不包包括数据库的的内容。这些些目标模式被被保存在数据据字典(或系系统目标)之之中,作为DDBMS存取取和管理数据据的基本依据据。例如,DDBMS根据据这些模式定定义,进行物物理结构和逻逻辑结构的映映象,进行逻逻辑结构和用用户视图的映映象,
21、以导出出用户要检索索的数据的存存取方式。(2)数据操纵纵功能 DBBMS提供数数据操纵语言言(Dataa Maniipulattion LLanguaageDML)实实现对数据库库中数据的一一些基本操作作,如:检索、插入入、修改、删删除和排序等等等。DMLL有两类:一类是嵌入入主语言的,如如嵌入到C或COBOLL等高级语言言中。这类DDML语言本本身不能单独独使用,故此此称为宿主型型的DML或嵌入入式DML。另一一类是非嵌入入式语言(包包括交互式命命令语言和结结构化语言),它它的语法简单单,可以独立立使用,由单单独的解释或或编译系统来来执行,所以以一般称为自自主型或自含含型的DMLL。命令语言
22、言是行结构语语言,单条执执行。结构化化语言是命令令语言的扩充充或发展,增增加了程序结结构描述或过过程控制功能能,如循环、分分支等功能。命命令语言一般般逐条解释执执行。结构化化语言可以解解释执行,也也可以编译执执行。现在DDBMS一般般均提供命令令语言的交互互式环境和结结构环境两种种运行方式,供供用户选择。DBMS控制和执行DML语句(或DML程序),完成对数据库的操作。对于自主型的结构化的DML,DBMS通常采用解释执行的方法,但也有编译执行的方法,而且编译执行的越来越多。另外,很多系统同时设有解释和编译两种功能,由用户选其一。对于嵌入型或缩主型DML,DBMS一种提供两种方法:预编译方法。修
23、改和扩充主语言编译程序(亦称增强编译方法)。预编译方法是,由DBMS提供一个预处理程序,对源程序进行语法扫描,识别出DML语句,并把这些语句转换成主语言中的特殊调用语句。主语言必须和DML有调用接口。这样在连接形成目标时和主语言语句一起形成可执行的目标。(3)数据库运运行管理 数据库运行行期间的动态态管理是DBBMS的核心心部分,包括括并发控制、存存取控制(或或安全性检查查、完整性约约束条件的检检查)、数据据库内部的维维护(如索引引、数据字典典的自动维护护等)、缓冲冲区大小的设设置等等。所所有的数据库库操作都是在在这个控制部部分的统一管管理下,协同同工作,以确确保事务处理理的正常运行行,保证数
24、据据库的正确性性、安全性和和有效性。(4)数据库的的建立和维护护功能 数据库的建建立和维护包包括初始数据据的装入、数数据库的转储储或后备功能能、数据库恢恢复功能、数数据库的重组组织功能和性性能分析等功功能,这些功功能一般都由由各自对应的的实用功能子子程序来完成成。DBMSS随软件产品品和版本不同同而有所差异异。通常大型型机上的DBBMS功能最最全,小型机机上的DBMMS功能稍弱弱点,微机上上的DBMSS更弱些。但但是,目前,由由于硬件性能能和价格的改改进,微机上上的DBMSS功能越来越越全。三、关系数据库库的标准语言言SQLL1.SQLL概述SQL的英语语名称是结构构查询语言(Structur
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 系统 工程师 复习资料 41980
限制150内