第一章:
1.简述空间数据的结构特点及用传统商用关系数据库管理空间数据的局限性:
答:1.结构特点:(1)从数据组织和管理角度看,空间数据与一般的事务数据相比具有非结构化特征(2)相对于一般的事务数据而言,空间数据量大(3)用以描述事物或现象随时间的变化2.局限性:(1)表示某种空间对象实体记录的空间字段难于预先确定(2)空间信息有坐标系统(3)关系数据原有的功能不能满足地理空间应用要求
2.空间数据管理的演化过程
答:1.人工管理阶段(20世纪xx年代中期)特点:(1)数据不保存(2)没有数据管理软件
(3)数据冗余2.文件系统阶段(20世纪xx年代中期)特点:(1)数据文件是大量数据的集合形式(2)面向用户的数据文件(3)数据文件与对应的程序具有一定的独立性(4)由初期的顺序文件发展为索引文件、链接文件、直接文件等3.文件与数据库系统混合管理系统(20世纪xx年代初期)特点:(1)对用户观点的数据进行严格细致的描述(2)允许用户以记录或数据项作单位进行访问(3)数据的物理存储可以很复杂,同样的物理数据可以导出多个不同的逻辑文件4.全关系型空间数据库管理系统(20世纪xx年代后期);5.对象关系数据库管理系统;6.面向对象的数据库系统
3..空间数据库的研究内容:
答:1.地理空间数据的获取与处理:(1)空间数据库的准确性研究;(2)空间数据质量研究;
2.地理空间数据组织(1)空间数据的多种表达方式研究;(2)时空关系的研究;(3)海量空间数据库的结构体系研究3.地理空间数据库系统:(1)空间关系语言研究(2)分布处理和Client/Server模式4.地理空间数据共享的研究
4.松散双元空间数据管理的结构及其弊端
文件与数据库系统混合管理系统(20世纪xx年代初期)特点:(1)对用户观点的数据进行严格细致的描述(2)允许用户以记录或数据项作单位进行访问(3)数据的物理存储可以很复杂,同样的物理数据可以导出多个不同的逻辑文件
答:
第二章:
1.基于实体空间对象描述的基本特点:
答:基于对象的模型强调个体现象,对象之间的空间位置关系通过所谓拓扑关系进行连接,主要描述不连续的地理现象,适合表示有固定形状的空间实体
2.基于场模型地理空间描述适应的地理变量的分布特点:
答:分布特点:在一定空间内连续分布。将地理空间的事物和现象作为连续的变量来看待。基于场模型可分为:图斑模型、等值线模型、选择模型
3.栅格数据操作的基本类型:
答(1)局部操作;(2)聚焦操作;(3)区域操作;(4)全局操作(5)图像操作
4.矢量数据向栅格数据转移的基本算法
答:(1)内部点扩散算法(2)复数积分算法(3)射线算法的扫描算法(4)边界代数算法
5.矢量数据与栅格数据结构的区别:
答:(1)栅格数据结构具有“属性明显,位置隐含”的特点,它易于实现,操作简单,有利于栅格的空间信息模型的分析,但栅格数据表达精度不高,数据存储量大,工作效率低;(2)矢量数据结构具有“位置明显,属性隐含”的特点,它操作起来比较复杂,许多分析操作(如叠置分析)用矢量数据结构难于实现;但它的数据表达精度高,数据存储量小,工作效率高。
6.非拓扑辩状矢量层文件数据组织与拓扑矢量文件数据组织的区别:
答: 非拓扑辫状矢量层文件的数据组织,它仅记录空间目标位置坐标和属性信息,而不记录它的拓扑关系,它可能有两种形式,一种是:每个点线面坐标直接跟随它的空间坐标;另
一种方式是:点坐标作为一个文件,线和多边形有点号组成。在非拓扑数据组织中,边界线数据均获取和存储两次,这就会产生裂隙或重叠,并产生数据冗余;为了消除裂隙,一般需要编辑。拓扑矢量层文件数据组织,实际上还仅仅是结点线面之间的关联拓扑关系,这种关系通常有两种表达关系:全显示表达和半隐含表达,全显示的表达是指结点弧段面块相互之间的所有关联拓扑关系,都用关系表显示的表达出来,关系除了要明确表示出来从上到下的拓扑关系,还要用关系表列出结点弧段面块之间的关系,但任然没有包括点与面,面与点的关联关系,这种关系是以弧段为桥梁建立的;半隐含表达则是用弧段—结点—弧段—面块的表格表示几何目标间的拓扑关系,建立空间目标之间的拓扑关系,这样一来修改面块—弧段的拓扑关系时,边界上内点移动只需进行一次,且只需修改弧段坐标数据文件即可,可以方便的实现数据共享问题。
7.简述线状网络数据模型设计的主要几何对象,并说明其文件组织的基本思想
答:形状网络模型主要几何要素:结点,几何弧段,逻辑弧段;文件分为结点文件,弧段坐标文件、拓扑关系文件、逻辑网段文件。结点文件记录坐标、关联边、结点其他属性;弧段坐标文件记录弧度中间点坐标拓扑关系文件记录起、终点坐标、坐标指针、其他属性;逻辑网段文件记录网段中逻辑关系;结点文件中坐标决定拓扑文件中起、终点,结点中的关联边、弧段坐标文件、拓扑关系文件中坐标指针构成逻辑网段文件。
8.简述基于polyvert的多边形网络拓扑数据结构的基本思想
答:polyvert包括结点文件、弧段中间坐标文件,多边形文件、拓扑文件、拓扑索引文件。结点、弧度中间坐标文件记录坐标;多边形文件记录多边形弧段序列指针;拓扑文件包括弧段标志号,中间点坐标个数及其指针,起、终点,左、右多边形;拓扑索引文件记录地址指针。多边形文件通过拓扑索引文件与拓扑文件相关联;拓扑文件通过中间点坐标指针与弧段中间坐标文件相结合,通过起、终点与结点文件相结合。
第四章:
1.简述数据的逻辑层次单位和物理层次单位,并给出逻辑记录与物理记录的定义:
答:(1)逻辑层次单位:数据项、记录、文件、数据库、数据仓库;物理层次单位:bit、字节、字、块;(2)逻辑记录:
2.试述逻辑记录的物理组织形式与各自的特点:
答:(1)定长记录固定组块:实现简单,只须说明块的体积和记录的长度(2)变长记录不跨界组块:把不同长度的记录存放到一个块中,要识别它们就必须给个记录时加一个长度指示器PR(3)变长记录跨界组块:一个记录在意个块中存放不下时,可以跨过边界存到另一个块中;(4)块列:将若干个数据块组成一个块列,文件系统的软件一次读/写整个块列,记录可跨越块的边界,但不允许跨越块列的边界。
3.在Hash文件组织中,何为碰撞?何为数据溢出?并说明处理桶数据溢出需用的方法 答(1)
5.空间索引的定义。它与传统文件索引有何不同。对空间数据建立空间索引的目的
答(1)空间索引:指依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定顺序排列的一种数据结构(2)不同:
6.空间数据库的静态索引和动态索引有何不同,二者具有哪些优缺点。
答:(1)静态索引是通过建立空间数据库中的逻辑记录与物理记录之间的静态索引表,使用各种查找算法,查找表结构,从而实现数据文件的索引。静态索引的实现比较简单,但修改很不方便,难以实现对数据文件实时的增加或删除(2)动态索引是在数据操作的过程中动态生成的索引结构。使用动态索引方法可以很方便地实现数据文件实时改动,但索引结构的实现复杂,维护索引结构需要计算时间和空间。
7.从技术层面上,空间索引分为哪几种形式,并说明每种形式各自特点:
答:(1)对象影射技术:该方法将K维对象转移成2K维空间上的点(2)对象复制和裁剪技术:将空间划分为不相交的子空间,并依据子空间的划分,将落在多个子空间的对象划分多个组成部分(3)重叠子空间方法:将地图划分为可以重叠的子空间,以便每个对象完全落在一个子空间。
8.简述格网空间索引实施的基本原理。传统格网索引与改进格网索引的区别:
答:网格空间索引基本原理是:将研究区域用横竖线条划分大致相等和不等的网络,记录每一个个网所包含的空间实体,当用户进行空间查询时,首先计算出用户查询对象所在的格网,然后再在该格网中快速查询所选空间实体。这样一来,就大大的加速了空间对象的查询速度。 区别:传统式一维,改进是二维
第五章:
1.在面向对象空间数据模型中,地理要素的几何抽象类型有哪些形式(拓扑形式与非拓扑形式两种分析)
答:(1)拓扑形式:结点、弧段、多边形、多面体
(2)非拓扑形式:点、线、面、表面、体
2.何为空间数据层的工作区?并简述工作区的无缝数据库与有缝数据库的各自特点。
答:(1)工作区:为了使计算机能够识别和处理地理要素,必须将连续地现实世界中地理实体及相互关系进行离散和抽象,建立若干以地理区域为界的认识地理空间的窗口。(2)无缝数据库:有统一的坐标系、无缝隙、不受传统图幅划分的限制,整个工作区域在数据库中相当于一个整体;有缝数据库:采用分块存储管理和处理,以数据块作为基本单位,一个数据块构成一个数据存储单位。
3.在考虑了空间数据库的分层及分块情况下,空间物体关系对象有哪几种形式?每一种形式主要表示何种空间关系?
答(1)结点和弧段之间的网络关系,弧段和多边形之间的多边形关系。数据块之间的相同空间物体连接关系、要素层之间的相关地理要素连接关系。
5.Coverage矢量数据模型的优缺点?
答:1.优点:(1)空间数据与属性数据相结点;(2)能够存储矢量要素之间的拓扑关系2.缺点:(1)空间数据不能很多的与其行为相对应;(2)以文件方式保存空间数据,而将属性数据存放在另外的DBMS中;(3)Coverage模型拓扑结构不够灵活,局部变动后则必须对全局的拓扑关系重新建立;(4)在不同的Coverage之间无法建立拓扑关系。
6.Geodatabase数据模型结构主要涉及到哪些基本组成要素?这种数据模型具有哪些特点? 答:(1)基本组成要素:要素类、要素数据集、关系类、几何网络、域、有效规则、栅格数
1在同一数据库中统一地管理各种类型的空间数据;据集、TIN datasets、定位器(2)特点:○
2.空间数据的录入和编辑更加准确;3.空间数据更加面向实际的应用领域;4.可以表达空间○○○
5.可以更好的进行制图;6.空间数据的表示更为准确;7可以管理连续的数据的相互关系;○○○
8支持空间数据的版本管理和多用户并发操作 空间数据,无需分块、分幅;○
第六章:
1.空间数据库的内容组成
答:从应用性质上空间数据库可分为基础地理空间数据库和专题数据库。基础地理空间数据库包括基础地形要素矢量数据(DLG)数字高程模型(DEM)、数字正射影像(DOM)、数字栅格地图(DRG)以及相应的元数据库(MD)。专题数据库(TD)包括土地利用书记、地籍数据、规划管理数据、道路数据等。
2.何为数据库的三级模式与两级映射?数据定义语言的作用及形式
答:1.三级模式:外模式(子模式或用户模式)、模式(概念模式或逻辑模式)、内模式(存
储模式);两级映射:子模式/模式映射、模式/存储模式映射;2.作用:定义数据的各种特征:形式:(1)模式DDL—定义数据库的全局逻辑结构;(2)子模式DDL—定义view(视图);
(3)DML—数据处理;(4)物理DDL—定义数据的物理存储方式。
3.基于文件系统的空间数据库体系结构:
答:1.文件组织:(1)定长记录(2)变长记录(3)聚蔟文件组织;2.空间数据引擎:基于特定的空间数据模型,在特定的数据存储、管理系统的基础上提供对空间的存储、检索等操作,以提供在此基础上的二次开发3.缓冲区管理:
4.基于数据库管理主流的空间数据库混合体系结构:
文件与数据库系统混合管理系统(20世纪xx年代初期)特点:(1)对用户观点的数据进行严格细致的描述(2)允许用户以记录或数据项作单位进行访问(3)数据的物理存储可以很复杂,同样的物理数据可以导出多个不同的逻辑文件
5.分步式空间数据库的模式结构?并说明其全局用户视图,全局概念模式,局部内容与数据库的三级模式有何区别?在该模式的结构中,分布式空间数据库管理系统与局部空间数据库管理系统起的作用有何不同?实现多空间数据库集成需要解决的主要问题是什么?
分步式空间数据库的模式结构是:模式结构总体可以分为两部分,一是集中式空间数据库的模式,代表了各场地上参与空间数据库系统的基本结构;二是,分布式空间数据库系统增加的模式。
区别:一个分布式空间数据库是由若干个已经存在的相关空间数据库集成的,全局用户视图,全局概念模式,局部内容是针对于一个分布式空间数据库而言的。数据库的三级模式是针对于一个空间数据库而言的,全局用户视图相当于数据库的外模式,全局概念模式相当于数据库的模式,局部内容相当于数据库的内模式。
在该模式的结构中,对于用户来说,在分布式空间数据库管理系统中,智能进行基础的操作,而不能定义自己的视图,而在局部空间数据库管理系统中用户却可以定义自己的视图。 实现多空间数据库集成需要解决的主要问题:一:选择全局统一的空间数据库模型来描述全局概念模式和分片模式;二:选择全局统一的空间查询语言作为全局系统和用户交互界面;三:解决分片的异构性,实现局部概念模式到全局分片模式的转换,即异构同化;四:解决分片冲突问题,构造全局的概念模式,即同构整体化。
第二篇:空间数据库学习总结
常见的名词:
1. 形成分辨率由粗到细、数据量由小到大的金字塔结构。
2. TIN模型:(不规则三角网模型)重叠、结构最佳的三角形。
3. 数字地形模型:是地形表面形态属性信息的数字表达,是带有空间位置特征和地形属性
特征的数字描述。
4. 数字高程模型(DEM):数字地形模型中地形属性是高程
高斯-克里格投影的特点
1. 中央经线为直线,而且是投影的对称轴
2. 高斯-克里格投影是等角投影,投影后具有角度不变伸长固定的特点,满足等角的要求
3. 中央经线长度没有变形,离中央经线越远变形越大。
E-R模型;
(1) 包含:实体、联系、属性三种基本成分。
(2) 概念设计的结果可以用E-R图进行直观地描述和表达。
(3) 实体类型是对实体的抽象,表示一类相似的对象。
(4) E-R图中:实体用方框表示,联系用菱形框表示,属性用圆圈表示。
(5) 一个实体必须有至少一个唯一标识符
(6) 实体间的联系可以分为多种类型,包括:多对多,多对一,一对一
(7) E-R模型还允许实体进入联系的方式,在E-R图中:表示强制性参与用双线表示,可选
性参与用单线表示
(8) 联系不仅能连接两个实体类型,也可以连接多个实体类型,甚至可以连接一个实体类型
及其自身
(9) 有的实体本身不能依据其属性值唯一地被识别,而必须依赖于它所联系的其他实体才能
被识别。这种称为依赖性实体(弱实体)
思考题:
1.什么是空间数据库?
空间数据库是以特定的信息结构和数据模型表达、存储和管理从地理空间中获取的某类空间信息,以满足不同用户对空间信息需求的数据库。
2.空间数据库系统包括哪几部分?
1.空间数据库
2.空间数据库管理系统
3.数据库应用系统
3.空间数据库主要作用有哪些?
1.海量数据的管理能力
2.空间分析功能
3.设计方式灵活,满足用户要求
4.支持网络功能
5.影响空间数据库发展的关键因素是哪几个?
1.空间数据库的计算平台;
2.空间数据模型;
3.空间数据库的组织管理模式。
1.什么是空间实体?
空间实体是具有确定的位置和形态特征并具有地理意义的地理空间的物体。
2.什么是空间索引?它包括哪些索引方式?
空间索引(空间访问方法):指依据空间对象的位置和形状或空间对象之间的某种关系按一定的顺序排列的一种数据结构。
4.什么数据挖掘?数据挖掘的对象主要包括哪几种?空间数据挖掘有哪些方法?
1.数据挖掘是发现隐藏在大型数据库中有意义的、潜在有用的信息模式的过程。
2.(1)关系型数据库(2)数据仓库(3)事务数据库(4)新发展的数据库应用(5)Web数据
3.(1)空间分析方法(2)统计分析方法(3)归纳学习方法(4)聚类与分类方法(5)探测性的数据分析方法(6)粗集方法
什么是Geodatabase?Geodatabase数据模型的主要技术优势是什么?
1.地理数据库是为了更好的管理和使用地理要素数据,而按照一定的模型和规则组合起来的地理要素数据集(Feature Datasets)。
2.①在同一数据库中统一地管理各种类型的空间数据②空间数据的录入和编辑更加准确③空间数据更加面向实际的应用领域④可以表达空间数据的相互关系⑤可以更好的进行制图⑥空间数据的表示更为准确⑦可管理连续的空间数据,无需分块、分幅⑧支持空间数据的版本管理和多用户并发操作
3、什么是数据模型?什么是E-R模型?
1.数据模型是关系数据和联系的逻辑组织形式的表示,以抽象的形式描述系统的运行与信息流程,是计算机数据处理中一种较高层的数据描述
4、E-R模型有几部分组成?在E-R图中,各部分又是如何表示的?
1.包含三个基本成分:实体、联系和属性
5、关系数据模型具有哪些优缺点
优点:
? 结构简单灵活
? 其数据描述具有较强的一致性和独立性
缺点:
? 实现效率不高
? 不适合于管理复杂对象的要求
? 模型的可扩充性较差
? 模拟和操纵复杂对象的能力较弱
什么是数据字典?什么是聚类?
1.数据字典也叫数据目录,它是数据库设计与管理的有利工具。
3、空间数据库系统的体系结构主要有哪些?
(1).基于文件系统的体系结构
(2).基于文件系统与数据库的混合体系结构
(3).基于数据库管理系统的体系结构
(4).空间数据库系统的集中式体系结构
(5).数据库系统的客户/服务器体系结构
1、空间数据库设计主要有几个阶段,各阶段的任务是什么?
(1)需求分析
(2)概念结构设计
(3)逻辑结构设计
(4)物理结构设计
2、面向对象数据库有哪些主要特征?
(1)对象(2)对象类(3)继承(4)持久性、对象标识(5)并发控制(6)阻抗失配
3、空间数据库设计的基本目标是什么?
(1)满足用户要求
(2)准确模拟现实世界
数据模型的性质和数据库设计的质量。
(3)良好的数据库性能
减少冗余数据、有利于快速访问数据。
(4)能够被某个数据库管理系统接受
4、概念设计包括哪几个步骤?
(1)确定应用领域(2)确定用户需求(3)选择对象类型(4)对象类型定义和属性描述(5)对象类型的调整(6)几何表示(7)关系(8)质量要求(9)编码
6、地理信息元数据主要包括哪些内容?
(1)标识信息(2)数据质量信息(3)空间参照系统信息对数据集使用的空间参照系统的说明。(4)内容信息(5)分发信息(6)核心元数据参考信息发布与更新的日期,建立核心元数据单位的联系信息。
7、空间数据库的设计内容是什么?
(1)静态设计
即结构特性设计。包括概念结构设计和逻辑结构设计。
(2)动态特性设计
确定数据库用户的行为和动作-数据库的行为特性设计,包括设计数据库查询、事务处理和报表处理等。
(3)物理设计
根据动态特性,把静态特性设计中得到的数据库模式加以物理实现-设计数据库的存储模式和存取方法。
8、简述面向对象数据库分析和设计的步骤及各阶段的工作重点。
(1)问题定义
提出一些全局性的问题,查明开发意图和开发目标。
(2)系统分析
理解应用领域的问题,建立它的三种模型:对象模型、动态模型和功能模型。
(3)系统设计
系统设计阶段的工作内容:
①设计系统的体系结构
②选择一个外部控制的实现方法
③选择数据管理方法和数据库管理模式
④确定重用范围
⑤选择一种对象标识方法
⑥选择数据交互的策略
⑦处理临时数据
⑧处理辅助数据
(4)详细设计
①使用变换来简化和优化分析阶段的对象模型
②补充漏掉的细节,进一步完善对象模型
③详细设计模型质量的评估
1、 阐述如何进行空间数据建库,并绘出建库流程图。
1、数据字典和数据索引的生成
2、图形与属性数据库的建立
3、设立用户密码、规定用户使用权限
4、软件系统与数据的融合检查
5、数据库系统试运行测试
2、 空间数据质量问题的影响因素有哪些?
1、空间现象自身的不稳定性
2、空间现象的表达
3、数据处理中的误差
4、矢量基础地理数据使用中的误差
1、 什么是GIS互操作?
互操作,是指异构环境下两个或两个以上的实体,尽管他们实现的语言,执行的环境基于的模型不同,但它们可以相互通信和协作,以完成某一特定任务。
GIS互操作是在异构数据库和分布计算的情况下出现的。
2、 什么是空间数据仓库?
空间数据仓库就是实现对分散的、各自独立的现有多种地理空间数据库系统进行统一集成和管理,形成用户获取测绘数字产品的统一模式、界面和标准,然后按照相应的主题查询数据仓库得到多种测绘数字产品,再根据用户需求通过各种专业模型关联多种专题信息,从多维角度进行分析,满足用户空间辅助决策分析信息的
需求。
3、 什么是OpenGIS?OpenGIS标注具有哪些特点?
(Open GIS)是指在计算机和通信环境下,根据行业标准和接口所建立起来的地理信息系统
OpenGIS标准:六个层次:应用服务、共享领域服务、公共设施服务、分布式计算与对象服务、平台服务、外部实体服务。
特点:
(1)可互操作(2)信息协会的支持
(3)普遍性(4)可靠性
(5)便于使用(6)可移植
(7)共用(8)可扩充
(9)兼容
1. 地理系统的概念。 是指各自然地理要素通过能量流、物质流和信息流的作用结合而成的,具有一定结构和功能的整体,即一个动态的多等级开放系统
2. 谈谈矢量数据模型和栅格数据模型各自的优缺点。
3. 你对WebGIS的应用现状及其发展趋势如何看待?
4、 谈谈你对空间数据库应用前景的看法。
5、 2、什么是SDE 、GML、XML?
GML是XML在地理空间信息领域的应用(利用GML可以存储和发布各种特征的地理信息,并控制地理信息在Web浏览器中的显示。
XML:用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。
6、 当前空间数据库存在的主要问题是什么?