数据库老师画的重点
数据库:数据库是长期存储在计算机内、有组织、可共享的大数据集合。
数据库操纵功能:查询select、插入insert、删除delete、修改update
数据库系统的特点:1数据结构化2数据的共享高,冗余度低,易扩充3数据独 立性高4数据由DBMS统一管理和控制
数据模型的组成要素:数据结构、数据操作、完整性约束
概念模型:要出大体,画图
信息世界中的基本概念————
1、实体:客观存在并可以相互区别的事物称为实体
2、属性:实体所具有的某一特性
3、码(key):唯一标识实体的属性集称为码
4、域(domain):域是一组具有相同数据类型的集合
5、实体型(entity type):具有相同属性的实体必然具有共同的特征和性质。用实体名
及属性名集合来抽象和刻画同类实体,称为实体型。
6、实体集(entity set):同一类型的实体的集合
7、联系:在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中
反应为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指
组成实体的各属性之间的联系;实体之间的联系通常是指不同实体集之间的联系
最常用的数据模型:
1、层次模型(Hierarchical Model)
2、网状模型(Network Model)
3、关系模型(Relational Model)
4、面向对象模型(Object Oriented Model)
5、对象关系模型(Object Relational Model)
其中层次模型和网状模型统称为格式化模型
数据库系统的三级模式结构:
1、模式(scheme):模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,
是所有用户的公共数据视图。他是数据库系统模式结构的中间层,
既不设计涉及数据的物理存储细节和硬件环境,也与具体的应用程
序、所使用的应用开发工具及高级程序设计语言无关。
2、外模式(external schema):外模式也称为子模式(subschema)或用户模式,他是数
据库用户(包括应用程序员和最终用户)能看见和使用
的局部数据的逻辑结构和特征的描述,是数据库用户的
数据视图,是与某一应用有关的数据的逻辑表示。
3、内模式(internal scheme):内模式也称存储模式(storage schema),一个数据库只有
一个内模式。他是数据库物理结构和存储方式的描述,是
数据在数据库内部的表达方式。
数据库的二级映像功能与数据库独立性————
为了能够在系统内部实现这3个抽象层次的联系和转换,数据库管理系统在这三个模式
之间提供了两层映像:
·外模式/模式 映像
·模式/内模式 映像
正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性
关系(relation):D1*D2*D3··*Dn的子集叫做在域D1、D2、D3···Dn上的关系,表示 为R(D1、D2、D3···Dn)
这里的的R表示关系的名字,n是关系的目或度(degree)
关系中每个元素是关系中的元组,通常用t表示
当n=1时,称关系为单元关系(unary relation),或一元关系
当n=2时,称该关系为二元关系(binary relation)
关系是笛卡尔积的有限子集,所以关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。由于域可以相同,为了加以区分,必须对每列起一个名字,称为属性(attribute)。n目关系必有n个属性。
若关系中的某一属性组的值能够唯一的标识一个元组,则称该属性组为候选码(candidate key)
若一个关系有多个候选码,则选定其中一个为主码(primary key)
候选码的诸属性称为主属性(prime attribute)。不包含在任何候选码中的属性称为非主属性(non-prime attribute)或非码属性(non-key attribute)
P46 没有搞明白干嘛使得!!!!!!!!!!!!!!!!!!!!!
关系的三类完整性约束:实体完整性、参照完整性、用户定义的完整性
实体完整性和参照完整性被称作关系的两个不变性
1、实体完整性(entity integrity):主码中的属性即主属性不能取空值
2、参照完整性(referential integrity):
若属性(或属性组)F是基本关系R的外码,它与基本关系S的的主码K相对应(基 本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:
·或者取空值(F的每个属性值均为空值)
·或者等于S中某个元组的主码值
SQL(Structured Query Language),即结构化查询语言,是关系数据库的标准语言。 SQL 的特点:
1、综合统一
2、高度非过程化
3、面向集合的操作方式
4、以同一种语法结构提供多种使用方式
5、语言简洁、易学易用
SQL的动词:
数据查询:select
数据定义:create、drop、alter(房间)修改表
数据操纵:insert、update(家具)修改数据、delete
数据控制:grant、revoke
绘制ER图————
在ER图中有如下四个成分:
矩形框:表示实体,在框中记入实体名。
菱形框:表示联系,在框中记入联系名。
椭圆形框:表示实体或联系的属性,将属性名记入框中。对于主属性名,则在其名称下 划一下划线。
连线:实体与属性之间;实体与联系之间;联系与属性之间用直线相连,并在直线上 标注联系的类型。(对于一对一联系,要在两个实体连线方向各写1; 对于一对
多联系,要在一的一方写1,多的一方写N;对于多对多关系,则要在两个实体 连线方向各写N,M。
基本表是本身独立存在的表,在SQL中一个关系就对应一个基本表。一个(或多个)基本表对应一个存储文件,一个表可以带若干索引,索引也可以放在存储文件中。
存储文件的逻辑结构组成了关系数据库的内模式。存储文件的物理结构是任意的,对用户是透明的。
视图是从一个或几个基本表导出的表。它本身不独立存储在数据库中,即数据库中只存放视图的定义而不存放视图对应的数据。这些数据仍存放在导出视图的基本表中,因此视图是一个虚表。视图在概念上与基本表等同,用户可以在视图上再定义视图。
基本表的定义、删除与修改:
1、定义基本表:create table ***()
2、定义主键:Primary key == not null (中间不用连接符号)unique
3、定义外码的语句:foreign key (某个字段)references 某表(某字段)
4、定义主码语句:primary key(***,***)
5、修改基本表:alter table 某表名 add 列名<数据类型>[完整性约束]
drop <完整性约束名>(字段名)
alter column<列名><数据类型>
6、删除表:drop table 表名[restrict | cascade级联删除]
7、建立索引:create [unique] [clustered] index 索引名
on 表名(列名[asc | desc],······)
·clustered 表示是聚簇索引
·unique表明此索引的每一个索引值只对应唯一的数据记录
·用户可以在最经常查询的列上建立聚簇索引以提高查询效率
·在一个基本表上只能建立一个聚簇索引
·建立局促索引后,更新该索引列上的数据时,往往导致表中记
录的物理顺序的额变更,代价较大,因此对于经常更新的列不
宜建立聚簇索引
8、删除索引:drop index <索引名>
上机的时候不太一样:drop index 表名。索引名字
9、数据的查询:
select [all | distinct] <目标列表达式>,······
from 表名或者视图名,···
where 条件表达式
group by 列名1 [having 条件表达式]
order by 列名2 [asc | desc]
·如果有group by 子句,则结果按“列名1”的值进行分组,该属性列值相
等的元组为一个组。通常会在每组中作用聚集函数。如果group by 子句带 having短语,则只有满足指定条件的组才予以输出。
·如果有order by 子句,则结果表按“列名2”的值的升序或降序排序
·select Sname Name,‘Year of Birth:’Birth,20xx-Sage Birthday,lower
(Sdept) Department
from Student
lower表示小写
常用的查询条件————
比 较:大于、等于、小于、不等于(< >/!=)、大于/小于等于、不小于、不大于、 not+上述比较运算符
确定范围:between and ,not between and
确定集合:in ,not in
字符匹配:like,not like
空 值:is null ,is not null
多重条件(逻辑运算):and,or,not
例子————
·select Sname,Sage
from Student
where Sdept (not) in (‘cs’,‘ma’,‘is’)
字符匹配:[not] like ‘字符串’[escape‘换吗字符’] 百分号表示任意长度、下划线表 示任意单个字符
聚集函数————
count ([distinct | all] *) 统计元组个数
count ([distinct| all] 列名) 统计一列中值的个数
sum ([distinct| all] 列名) 计算一列值的总和(此列必须是数值型) avg ([distinct| all] 列名) 计算一列的平局值(此列必须是数值型) max ([distinct| all] 列名) 求一列中的最大值
min
·如果指定distinct短语,则表示在计算时要取消指定列中的重复值。如果不指定distinct 短语或者指定all短语(all为缺省值),则表示不取消重复。
·注意在聚集函数遇到空值时,除count(*)外,都跳过空值而只处理非空值。 ·注意where子句中不能用聚集函数作为条件表达式
group by子句————
where 子句与having 短语的区别在于作用对象不同。Where 子句作用对象作用于基本表或试图,从中选择条件的元组。Having短语作用于组,从中选择满足条件的组。
例子:select Sno from SC
group by Sno
having count(*)>3
查询了选修3门以上课程的学生学号
链接查询——————
例子:
非自然链接
·select Student.*,SC.*
from Student,SC
Where Student.Sno=SC.Sno
自然链接
·select Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade
from Student,SC
where Student.Sno=SC.Sno
自身链接
·select FIRST.Cno,SECOND.Cpno
from Course FIRST ,Course SECOND
where FIRST.Cpno=SECOND.Cpno
外连接
·select Student.Sno,Sname,Sage,Sdept,Cno,Grade
from Student left outer join SC
on Student.Sno=SC.Sno
·左外链接列出左边关系中所有的元组,右外连接列出右边关系中的所有元组
嵌套查询
·select Sname from Student
where Sno in (select Sno from SC where Cno=‘2’)
·找出每个学生超过他选修课程平均成绩的课程号
Select Sno,Cno
From SC x
Where Grade >= (select avg (Grade)
From SC y
Where y.Sno=x.Sno
)
授权————
Grant 权限 ,·····
On 对象类型 对象名 ,·····
To 用户,·····
[with grant option]只一句表示权限的传递
例子:
·Grant all privileges
On Student,Course
To U1,U2
·grant update (Sno),select
on Student
to u4
·revoke update(Sno)
on table Student
from u4
一个满足BCNF的关系模式有:
·所有非主属性对每一个码都是完全函数依赖 3NF
编辑 3NF,即第三范式是要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。 满足第三范式(3NF)必须先满足第二范式(2NF)
2NF(第二范式)
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被唯一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。如图3-2 员工信息表中加上了员工编号(emp_id)列,因为每个员工的员工编号是唯一的,因此每个员工可以被唯一区分。这个惟一属性列被称为主关键字或主键、主码。
第二篇:数据库总结
数据库考试要点总结
第一章:
1. 数据管理技术发展的三个阶段以及各自的特点?
答:数据管理技术的发展可以大体归为三个阶段:人工管理阶段、文件系统阶段和数据库系统阶段。
人工管理数据具有以下特点:数据不保存在计算机内;需要应用程序管理数据;数据不共享;数据不具有独立性。
文件系统阶段特点:数据以“文件”形式可以长期保存;由文件系统管理数据。但文件系统仍存在缺陷:数据共享性差,冗余度大;数据独立性差。
数据库系统阶段:采用数据模型表示复杂的数据结构;有较高的数据独立性;数据的共享性高,冗余度低,易扩充;数据由DBMS统一管理和控制。
2. DBMS有哪些功能?
答:(1).数据库的定义功能。DBMS提供DDL定义数据库的结构、包括外模式、内模式及其相互之间的映象,定义数据的完整性约束、保密限制等约束条件. (2.)数据库操纵功能。DBMS提供DML实现对数据库的操作。基本的数据操作有四种:检索、插入、删除和修改。(3).数据库运行控制功能。DBMS对数据库的控制主要通过四个方面实现:数据安全性控制数据完整性控制、多用户环境下的并发控制和数据库的恢复。
3. 数据的物理独立性和逻辑独立性
答:物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。即,数据在磁盘上怎样存储由DBMS(DataBase Management System 数据库管理系统)管理,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变了,应用程序不用改变。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,即,当数据的逻辑结构改变时,用户程序也可以不变。
4. 数据模型组成的三要素:数据结构,数据操作和完整性约束。
5. 数据的完整性约束包括以下几个方面:1.域完整性.
2.实体完整性.
3.参照完整性
6. 数据库的三级模式和二级映像?
答:数据库的三级模式由外模式,模式,内模式三级构成。
二级映像:外模式/模式映像;模式/内模式映像。
7. 数据库系统的组成?
答:数据库系统包括的软件有:DBMS;支持DBMS运行的操作系统;具有与数据库接口的高级语言及其编译系统;以DBMS为核心的应用程序开发工具;数据库应用系统。
数据库系统的人员主要是:数据库管理员,系统分析员和数据库设计人员,应用程序员和最终用户。
8. 要会画E-R图,会判断码,外码。
第二章:
1. 关系的三类完整性约束:实体完整性,参照完整性和用户定义完整性。
实体完整性规则:若属性(指一个或一组属性)A是基本关系R的主属性,则A不能取空值。参照完整性规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:
1)取空值(F的每个属性值均为空值);
2)等于S中某个元组的主码值。
用户定义完整性:是指某一具体的实际数据库的约束条件,由应用环境所决定,反映某一具体应用所涉及的数据必须满足的要求(比如说一个人的年龄必须要大于零),根据现实生活中的一个实际情况用户定义的一个用户自定义完整性。
2. 会用关系代数书写关系模式。(选择,投影和连接)p55
第二章:
第三章:
第四章: