《空间数据库复习题.doc》由会员分享,可在线阅读,更多相关《空间数据库复习题.doc(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、. .Chapter 1: Introduction to Spatial Databases1、举例说明什么是空间数据、非空间数据?如何理解空间查询spatial queries和非空间查询的区别Non-spatial queries?答:河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据 书店名称 店员人数,去年的销售量,等是非空间数据空间查询是对空间数据的查询或命令2、什么是GIS,什么是SDBMS?请阐述二者的区别和联系。答:1、GIS是一个利用空间分析功能进展可视化和空间数据分析的软件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量 GIS 可以
2、利用SDBMS来存储、搜索、查询、分享大量的空间数据集 2、SDBMS是一个软件模块。它可以、利用一个底层的数据库管理系统、支持多种空间数据模型、相应的空间抽象数据类型ADT以及一种能够调用这些ADT的查询语言、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规那么3、区别与联系:、利用GIS可以对某些对象和图层进展操作,而利用SDBMS那么可以对更多的对象集和图层进展更加简单的操作、SDBMS可以在GIS不能使用的某些领域进展使用,例如基因组学、天文学、多媒体信息系统等、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。3、从GIS这一缩写的
3、三种含义来理解GIS的开展历程。答:地理信息系统:为专业人员提供的软件地理信息科学:为地理信息系统和效劳提供使用和开展的定义、框架和理论地理信息效劳:为普通用户提供的网点和效劳中心,例如PC机上的地理和空间效劳4、用传统数据库系统管理空间数据,存在什么缺乏之处?答:1无法用递归和嵌套的方式来描述复杂关系的层次和网状构造,模拟和操作复杂地理对象的能力较弱;2用关系模型描述本身具有复杂构造和涵义的地理对象时,需对地理实体进展不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理;3由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高4空
4、间数据通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。 5一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等根本操作。 6一般DBMS不能支持GIS需要的一些复杂图形功能。7一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。 8GIS管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的平安维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统数据的完整性。否那么,一条记录的改变会
5、导致错误、相互矛盾的数据存在,而一般RDBMS难以实现这一功能。5、What is a SDBMS ?答:SDBMS是一个软件模块。它可以、利用一个底层的数据库管理系统、支持多种空间数据模型、相应的空间抽象数据类型ADT以及一种能够调用这些ADT的查询语言、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规那么6、什么是后关系数据库模型?后关系数据库模型有哪些?答:后关系数据库模型支持用户定义抽象数据类型,空间数据的类型可以添加。包括面向对象的数据库模式OOBDMS和面向关系ORDBMS的数据库模式。7、SDBMS的三层体系构造Three Layer Architecture是什么?
6、借此深入理解SDBMS的作用。答:空间应用空间数据库DBMS 教材P11的图8、空间数据库主要涉及哪些内容?答:数据模型、查询语句、查询处理与优化、文件组织和索引、数据挖掘9、举例说明单遍扫描查询和多遍扫描查询的概念。答:单边扫描查询中,被查询的表关系中的一条记录元组最多只被访问一次;例如“列出武大周围5km内的书店的名字。多遍扫描查询是被查询的表关系中的一条记录元组至少被访问一次,例如“找出其代表的选取X围大于200公顷并且在这区拥有公司的女议员的名字10、过滤精炼策略的作用?两个步骤的内容是什么?提示:ppt : Efficient algorithms to answer spatial
7、 queries mon Strategy - filter and refine过滤精炼 Filter Step:Query Region overlaps with MBRs of B,C and D过滤:查询区域与B、C、D的最小外接矩形有重叠局部,保存B、C、D,其他的舍弃 Refine Step: Query Region overlaps with B and C精炼:查询区域与B、C有重叠,舍弃D11、平面扫描(plane sweep)技术主要解决什么问题?其主要步骤?答:主要解决的是如何在过滤阶段中尽可能多的淘汰不符合条件的对,从而减少几何计算的计算代价。Step 1:从左至右
8、移动一条扫描线(例如,垂直于x轴的线),停在RS的第一个元素处。这就是具有最小Txl值的矩形T,例子为是矩形R4 。Step2:搜索S中已排序的矩形,直到抵达第一个矩形Sf,这里有Sfxl Txu。显然,对于所有1jf,关系Txl,TxuSjxl,Sjxu存在(非空),在本例中Sf就是S1。注意f是以图1-9c的数组索引为序,即S1=S2、S2= S1、S3=S3。这样S2就是一个可能与R4交叠的候选矩形。Step 3:如果对任意ljf,关系Tyl,Tyu Sjyl,Sjyu存在,那么Sj与T相交。因此,这一步就确定了R4与S2确实是交叠的,并且是连接结果的一局部。记录所有这样的信息,然后将矩
9、形TR4从集合RS中去掉,它不再需要参与结果集中的其他相交对。Step 4:继续移动扫描线来穿过集合RS,直至碰到下一个矩形,在本例中是S2。这时进展步骤2和3。Step 5:当 RS=时,处理完毕;12、从程序员的观点和DBMS设计者的观点看,影响系统效率的因素有何不同。答:在程序员看来,计算机主要包括两个局部:CPU和无限量的内存 在DBMS设计者看来,计算机主要包括三个局部:CPU、有限的内存、无限的硬盘空间。访问硬盘的速度要远远小于访问内存的速度,因此前者关注减少算法的计算时间,后者强调的是将计算时间和I/O时间的总和减少到最小。13、查询优化和数据挖掘的概念。答:查询优化:基于数据集
10、的特点对查询中的操作进展排序,为每一步操作选择有效策略 数据挖掘:即进展系统的搜索,找出隐藏在电子信息中潜在的有用信息。Chapter 2: Spatial Concepts and Data Models1、 什么是数据模型?举例说明数据模型的重要性。答、数据模型是数据集的特定构造和模式,是对数据的文件描述,有利于某些性质的前期分析。 作用:、属性的前期分析;、重利用多媒体应用中的共享数据;、组织中交换数据、将数据传递给新软件或环境例子:千禧年危机 正确的使用数据模式可以显著的降低本钱,如果软件中的时间和数据被定义成抽象数据模型,只有一小局部的软件会执行数据,ADT数据要被重新修改。2、 掌
11、握两种常用的空间信息模型:要素模型和场模型,矢量、栅格数据构造。答:场模型:、空间分割框架 、场函数 、场操作:并、复合森林模型中分段函数表示,区域中每个点被映射成主要树种对应的值 要素模型:、对象:把空间信息抽象成明确的,可识别的事物或实体;、对象具有属性和操作森林模型中多边形表示林分,每个对象有唯一的标示符、主要树种和一块区域。矢量数据构造栅格数据构造:栅格构造用密集正方形或三角形,多边形将地理区域划分为网格阵列。位置由行,列号定义,属性为栅格单元的值。点:由单个栅格表达。线:由沿线走向有一样属性取值的一组相邻栅格表达。面:由沿线走向有一样属性取值的一片栅格表达。3、 基于场模型的操作有哪
12、些,举例说明区基于场模型的局部操作、聚焦(focal)和区域操作?基于对象模型的操作有哪些?答:基于场模型:局部操作:空间框架内一个给定位置的新场的取值只依赖于同一个位置场的输入值。书上P31。 聚焦操作:在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值。 极限、高程场的梯度 区域操作:与聚集运算符或微积分中的积分运算有关。计算每个树种的平均高度。 基于对象模型:面向集合、拓扑、方位、度量空间4、 什么是拓扑关系,举例说明拓扑与非拓扑特性、拓扑与非拓扑操作。答:是指满足拓扑几何学原理的各空间数据间的相互关系。即用结点、弧段和多边形所表示的实体之间的邻接关联和包含等关系。 拓扑特性
13、:弹性变形后临近物体之间的拓扑关系没有发生改变 非拓扑特性:弹性变形后临近物体之间的拓扑关系发生了改变拓扑操作与非拓扑操作5、 OGIS提出的关于空间几何体的根本构件有哪些?6、 说明九交模型表达拓扑关系的原理。答:在一个平面上。两个对象A、B之间的二元拓扑关系主要基于以下的相交情况,即分别是A和B的内部、边界、外部。值六局部可以构成九交模型。考虑取值有空(0)和非空(1),可以确定有29=512种二元拓扑关系。对于R嵌在中的二维区域,有八个关系是可实现的,并且它们彼此互斥且完全覆盖。:相离、相接、交叠、相等、包含、在内部、覆盖、被覆盖。7、 数据库设计的三个步骤及其主要内容。答、首先,采用高
14、层次的概念数据模型来组织所有与应用相关的可用信息; 然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关 最后,数据库设计的第三个步骤是物理设计的建模,它解决数据库营养在计算机中具体实现是方方面面的细节。8、 ER模型的作用,ER图包括哪些要素,如何表达多值属性?ER图与空间信息对象模型之间的异同?答:ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节别离开来。ER图包括实体物理上或概念上独立存在的事物或对象、属性和联系。实体用属性来刻画性质,实体之间通过练习相互作用和关联。属性可以是单值或多值。ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。
15、码属性加下划线,多值属性用双椭圆。异同:、实体是物体属性的集合;、ER模型不允许普通用户定义操作;、在对象模型中关系不被直接支持,但可以由操作来模仿。9、 数据库三层约束的内容:码约束-实体完整性(entity integrity)约束,参照完整性(referential integrity约束和用户参照完整性。简述关系模式中的三种完整性。答;码约束:每个关系必须要有一个主码;实体完整性约束:主码不能为空;参照完整性约束:外码的属性值要么是另一个关系的主码,要么为空值。10、外码的概念。答:外码是一个关系的属性集,这个关系被复制到另外一个关系中。主码与外部码提供了一个实现关系间联系的手段。11
16、、ER图向关系模型的转换,注意对多值属性的转换。P16答:、实体成为关系;实体的属性映射成为关系的属性;多值属性形成新的关系、Relationships (1:1):将任一实体的码属性作为其他关系的一个外码、Relationships (M:1):将“1”侧的关系的主码作为“M侧关系的外码。、M:N Relationships bee a relation M:N中M和N共同形成新表的关键字12、对于空间数据,ER模型方法的缺乏之处?为表达空间概念,扩展ER模型主要增加了哪些要素?-实体象形图、关系象形图,读懂扩展ER模型的表示符号。书上P51答:1、ER模型的最初设计隐含了基于对象模型的假设
17、。因此,场模型无法用ER模型进展自然的映射 2、在传统的ER模型中,实体之间的联系由所要开发的应用来导出,而在空间建模中,空间对象之间总会有内在的联系 3、建模空间对象所使用额试题联系类型和“地图的比例尺有关13、举例说明用象形符号扩展ER图,对于空间数据建模有何好处? 用象形符号扩展ER图,以便专门处理空间数据类型。这将减少ER图以及所产生的关系模式的复杂度,同时改良空间建模的质量。空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表示。关系模式中的表达多值空间属性的关系和M:N空间联系也就不需要了 14、 举例说明类、属性、方法、聚合、泛化、和关联等概念
18、?答:类:是多有在应用中具有一样性质的对象的封装,等价于ER模型中的实体;例如设施就是一个类。 属性:描述类的对象。属性还有一个与之相关联的作用域,分为公有、私有、受保护 方法:是一些函数,是类定义的一局部,用来修改类的行为或状态 关系:将一个类与另一个类或者它自己相联系,类似于ER中的联系。UMLCD中三种重要关系:聚合、泛化、关联。 聚合:描述局部与整体的关系:强聚合、弱聚合 泛化:eg. 多边形是点线面的泛化; 关联:反响不同类的对象是如何联系的。15、 UML的作用?了解UML的主要符号。答:UML是用于面向对象软件设计的概念层建模的新兴标准之一,它是一种标准化语言,用于在概念层对构造
19、化模式和董涛行为进展建模。16、 比拟ER与UML。答:1、没有方法的类就是实体;2、属性在两个里都一样;3、UML中没有主键和完整性约束;4、ER中没有方法;5、ER中关系的内容更丰富;6、ER图中的实体与数据集有关,但UML的类几乎和数据集无关。Chapter 3 Spatial Query Languages1. Three ponents of SQL。请列举SQL所包含的功能,并对每种功能列举相关的操作符语句。答:数据定义语言DDL:创立和修改关系表包括索引数据操纵语言DML:插入,删除,更新,查询数据控制语言DCL:并发控制,事务处理2. SELECT specifies desi
20、red columnsFROM specifies relevant tablesWHERE specifies qualifying conditions for rows (限定条件)ORDER BY specifies sorting columns for resultsGROUP BY, HAVING specifies aggregation and statistics要求:看懂书上例句,要求会写语句3. 扩展SQL以处理空间数据,掌握对标准SQL进展了哪些方面的扩展?提示:ppt: SQL 3 allows user defined data types and operati
21、ons. Spatial data types and operations can be added to SQL3SQL3支持用户自定义类型和操作,空间数据类型和操作被允许参加到SQL3中4. Open Geodata Interchange Standard (OGIS)支持的Spatial Data Model和空间操作有哪些答:用于所有集合类型的根本操作;用于空间对象间拓扑关系的操作谓词;用于空间分析的一般操作5. 读懂List of Spatial Query Examples。给语句,说明查询目的?或者给出查询目的,要求写语句。6. view(视图)的含义。视图使用来描述导出数据
22、或查询结果简化复杂网状查询的表Chapter4: Spatial Storage and Indexing1、What is a physical data model?Why learn physical data model concepts?答:1、执行逻辑数据模型的理论根底,使用现有的构件在一个有效容错的方式中2、选择适宜的DBMS,某些DBMS不支持空间索引;使DBMS运行的更加有效率。2、Is relational DBMS physical data model suitable for spatial data?如果不适合,有哪两类解决途径?答:不适宜。关系DBMS那么只能对数
23、字进展简单处理;排序、查询树对数字非常有效,但这些概念都不适合用于处理空间数据提示:ppt 途径1Reusing relational physical data model concepts,重新使用关系物理数据模型的概念:Space filling curves define a total order for points用空间填充曲线来定义点的排列This total order helps in using ordered files, search trees有助于使用有序文件和查询树But may lead to putational inefficiency!但可能会导致计算无
24、效率途径2:New spatial techniques新空间技术:Spatial indices, e.g. grids, hierarchical collection of rectangles空间索引:例如网格Provide better putational performance能提供更好的计算表现3、计算机存储设备的种类?数据库系统是怎么利用各种设备的?提示:ppt:Types of storage Devices:Main memories - fast but content is lost when power is off主存:速度快,信息断电丧失Secondary st
25、orage - slower, retains content without power二级存储器:慢,信息断电不丢Tertiary storage 如磁带驱动器 - very slow, retains content, very large capacity脱机存储器:非常慢,保存信息容量非常大。DBMS usually manage data on secondary storage, e.g. disks Use main memory to improve performance User tertiary storage (e.g. tapes) for backup备份, ar
26、chival档案 etc.4、磁盘存储相关概念:磁道track、扇区sector、柱面cylinder?页面的概念?答:磁道:圆心磁盘片上向边缘延伸的同心圆扇区:每个磁道中被分成假设干等份的区域柱面:是磁盘上具有一样镭的磁道的集合页面:又称磁盘块。是磁盘与主存之间的最小传输单位5、访问磁盘扇区数据的过程,哪个过程花费的时间最多?提示:ppt: Accessing a sector has three major steps: Seek寻道: Move head assembly to relevant track ts 磁头到达特定磁道所用的时间 Latency(延迟时间): Wait for
27、 spindle to rotate relevant sector under disk headtl块旋转到磁头下方所用的时间 Transfer传输时间: Read or write the sector (tt)置于正确位置后读写块中数据的实际时间 1236、如何有效利用磁盘硬件?提示:ppt : Using Disk Hardware Efficiently Size of sectors扇区面积 Larger sector provide faster transfer of large data sets 数据集大时大扇区提供更快的传输速度 But waste storage sp
28、ace inside sectors for small data sets 但浪费了小数据集的存储空间 Placement of most frequently accessed data items放置频繁使用的数据 On middle tracks rather than innermost or outermost tracks 在中间的磁道而不是最里面或最外面的磁道 Reason: minimize average seek time可以减少寻道时间 Placement of items in a large data set requiring many sectors放置一个需要
29、很多扇区的大数据集 Choose sectors from a single cylinder尽量放在同一个柱面 Reason: Minimize seek cost in scanning the entire data set.减少扫描全集花费的时间7、 域(filed)、记录(record)、文件file的概念,提示: Mapping Records and files to Disk. Records Often smaller than a sector Many records in a sector Files with many records文件是记录的集合 Many sec
30、tors per file8、页面的概念:磁盘与主存之间的最小传输单位。一个文件可能跨越多个页面。一个页面是槽的集合,一个槽包含一条记录9、文件构造的含义,举例说明几种常用文件构造heap,Ordered、Hashed 、Clustered。答:文件构造是指文件中记录的组织形式。 堆:无序文件。记录没有特定的顺序。,根据给定的关键码(如name)查找一条记录需要扫描文件中的记录。在最坏情况下,文件的所有记录都要被检查,所有存储该文件数据的磁盘页面都要被访问。平均来说,需要检索一半的磁盘页面。优点是在进展插入操作时可以很容易地在文件末尾插入一条新记录。存储河流表 散列文件:使用散列函数吧记录分到
31、一系列散列单元中。可取之处在于它能够把数量大致一样的记录放入每个散列单元中。对于点查询、插入、删除都很有效。不适合X围查询。按字符个数存储城市名称。 有序文件:根据给定的主码与对记录进展组织。折半法非常有效。不能直接运用在空间领域例如,除非对多维空间中的点定义一个全序,否那么无法对城市的位置排序。有序文件组织方式还可以根据对空间数据集的文件组织方式而概括成空间聚类。 聚类:聚类的目的就是降低响应常见的大查询的寻道时间(ts)和等待时间(t1)。对于空间数据库来说,这意味着在二级存储中,空间上相邻的和查询上有关联性的对象在物理上应当存储在一起。10、使用空间填充曲线组织空间数据的意义?提示:Ch
32、apter 1 , Organizing spatial data with space filling curves Impose an ordering on the locations in a multi-dimensional space 加强了多维空间中的位置排序 Allow use of traditional efficient search methods on spatial data 允许在空间数据中使用传统的有效搜索11、掌握Z-曲线、hilbert曲线的生成。要求给IJ号,能够写出对应Z码和Hilbert码的计算过程12、基于Z-曲线,如何进展区域匹配的?匹配有效性?
33、答:用z1和z2分别代表两个z值,其中z1是较短的一个,并未失去一般性;对于相应的区域(比方块)r1和r2,只有两种可能:1)如果z1是z2的前缀(例如,z1=l*,z2=11*或z1=*l*,z2=11*),那么r1完全包含r2;2)两个区域不相交(例如,z1=*0*,z2=11*)。13、什么是索引?索引文件的内容。主索引和二级索引。A table can have at most one primary index. Why?答:索引文件是用来提高数据文件查询效率的辅助文件。记录的只有码值和数据文件中的页面地址。索引记录被排序,数据文件本身可以是不按关键码排序。主索引,如果数据文件的记录
34、是按照主码排列的,那么索引就只需要保存数据文件的每个磁盘页面第一个主码域值。每个索引记录一个数据页面。二级索引:堆数据文件,一个索引记录一个数据。一个磁盘最多只有一个主索引,因为主索引决定了数据在磁盘上的存储顺序。14、什么是空间索引?有哪些空间索引方法?答:空间索引构造用一组桶(通常对应二级存储的页面)来组织对象。空间索引呢就是依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据构造,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。方法:1)在系统中参加专门的外部空间数据构造,为空间属性提供如同B树之于线性属性的功能。2)使用空间填充曲线
35、(如Z序、Hilbert曲线)将空间对象映射到一维空间,以便空间对象存储在标准的一维索引(例如B树)中。15、网格文件包含哪两局部内容?建立格网索引的思路和步骤?了解R树索引和R+树索引的思想?答:包含n维网格目录,目录只能够的每一项指向一个数据桶。第二局部是由称为线性比例的一维数组组成的构造。思路:是将研究区域用横竖线条划分大小相等或不等的格网,记录每一个格网所包含的空间实体。当用户进展空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索引的查询速度。 步骤:划分行列M X N;计算网格大小及每个格网的矩形X围;开辟目标空间记录目标穿
36、过的网格和格网空间记录格网内的目标;注册点、线、面、注记等目标,并记录之;提取窗口所覆盖的目标关键字采用数据位方法,以降低排序时间,及防止数据的绘制顺序等;提取目标所涉及的网格。Chapter5 Query Processing and Optimization1、 从查询处理的角度来看,空间数据库与关系数据库之间有哪些主要区别?答:至少有三个主要区别:、与关系数据库不同,空间数据库没有固定的运算符集合可以充当查询计算的根本构件、空间数据库要处理非常大量的复杂对象,这些对象具有空间X围,不能自然的排列成一维数组。、检测空间谓语要用到计算量极大的算法,所以不能再假定I/O代价在CPU的处理代价中
37、只能主导地位2、 空间查询的根本构件有哪些? 提示:ppt5.1.2 Choice of building blocks,List of building blocksPoint Query,Range Query,Spatial Join,Nearest Neighbor;点查询:给定一个查询点P,找出所有包含它的空间对象OX围或区域查询:给定一个查询多边形P,找出所有与之相交的空间对象O空间:两个表R和S基于一个空间谓语进展连接时,该连接成为空间连接。最近邻居:空间聚集,即给定一个对象O,找出所有距离O最近的对象P3、 空间查询处理的“过滤-精炼模式是什么,其目的?对象操作的两步查询处理目
38、的:用两步算法高效地处理复杂的数据类型 过滤:寻找Q最终结果的超集S;精炼:利用GIS处理S来找到准确的Q的答案4、 空间查询处理中,一般是采用什么MBR)来替代不同类型的空间实体如线、面?这样做有何好处?提示:Ppt:Approximating spatial data typesMinimum orthogonal bounding rectangle (MOBR or MBR)最小外接矩形approximates line string, polygon, 近似的线串,多边形See Examples below (Black rectangle are MBRs for red obje
39、cts)MBRs are used by spatial indexes, e.g. R-treeMAlgorithms for spatial operations MBRs are simple空间操作MRS的算法很简单5、 举例说明SDBMS是如何利用空间实体的MBRs来加快处理速度的?Ppt:Approximate Spatial Operations6、 对于点查询、区域查询、空间连接查询操作,各自有哪些处理算法策略?它们与什么因素有关?提示:Strategies for Point Queries,Strategies for Range Queries,Strategies fo
40、r Spatial Joins与包含待查询的关系的文件的组织方式有关。答:点查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语 建立空间索引:在索引中使用find操作;需要查找的磁盘扇区等于索引的深度 空间填充曲线散列:运用折半法寻找点;检验大约logB(n),的磁盘扇区 区域查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语 建立空间索引:在索引中使用X围查询操作 空间填充曲线散列:验证Z值满足X围查询要求;使用折半查询找到最低的Z值;扫描前面的数据文件直至满足查询要求的最大的Z值空间连接:嵌套循环,检验所有可能的空间谓语对;基于空间分块,只检
41、验普通空间区域的对象对树匹配:从每X表中找出分层的的对象组7、 什么是查询优化器?查询优化器所承当的主要任务是什么?答:查询优化器是数据库软件中的一个模块,它用于产生不同计算方案并确定适当的执行策略。主要任务:逻辑转换、动态规划。8、 查询语言与查询树之间的互换? 语法分析器执行9、 对查询树进展逻辑转换的目的和一般方法是什么?答:方法:将非空间的选择和投影操作下推 目的:减少连接操作所涉及的关系大小,从而减少计算代价。10、 Distributed Environments的概念?在分布式环境下,空间数据库系统面临哪些挑战?提示ppt:New issues for SDBMS答:自治异质计算
42、机的集合,通过网络连接,效劳器框架:效劳器提供定义明确的效劳,用户使用效劳。 挑战:概念模型上:不同种类模式之间的转换逻辑模式上:在其他SDBMS上命名、查询表;其他SDBMS上的表要复制原始表 查询过程与优化:通过网路的数据传输代价将会主导CPU和I/O代价,需要新的策略来控制数据的传输本钱。11、 举例说明分布式空间数据库的半连接操作。书上P161答:1)只将连接属性和主码从站点1发送到站点22)只将有关元组从站点2发送到站点1.12、了解基于Web的空间数据库系统的体系构造。书上P162Chapter 6: Spatial Networks1、 举例理解空间网络、空间网络查询。铁路网络、
43、密西西比河河网,查询YW线沿途车站数量,最后一个车站,密西西比河的支流名称2、 图及其相关概念。答:一个图G=(V,E)是由一个有限顶点集V顶点之间的边集E组成的。边集E顶点集V的一个二元关系。 如果构成边集的各个顶点对是有序的,那么图G就是有向的(directed);否那么该图是无向的(undirected)。顶点和边有时也分别称为结点(node)和(1ink)。有序顶点对的第一个顶点称为前驱(predecessor)或者源(source),第二个顶点称为后继(successor)、目的(destination)或汇点(sink)。图的结点和有时要添加标号(Label)和权重(weight)
44、,以便表示附加的信息。如果两条边共享一个结点,那么它们是邻接的(adjacent),一系列邻接边组成一条路径(path)。例如,序列(v0,v1),(v1,v2),(vn-2,vn-1),(vn-1,vn)表示一条路径,因为每条边都与前一条边或者后一条边有一个公共结点。如果端点v0和vn是同一个结点,那么这条路径称为一个环(cycle)。河流网中没有环,而在铁路系统中,一条往返旅行线路构成一个环。3、 图的物理存储。邻接矩阵、邻接表书上P1824、 关系代数对于空间网络查询的主要缺陷?传递闭包的概念?5、 答:无法计算传递闭包。图G(V,E)的传递闭包G*是满足以下条件的图,它与G有一样的顶点
45、集V,但它的边集那么由G的所有路径组成。6、 SQL2 Connect语句的使用,会书上的例子。7、 SQL3 With Recursive 语句的使用8、 路径查询处理的种类:单对、单源、所有对。9、 答:一个常用的图操作就是确定道路网中两个点A和B之间的最短路径,路径计算可以分为: 单对(single pair) :给定一个图G=(V, E)和N中的顶点u与v,找出u与v之间的最优路径。单对的一个特例就是最短路径问题。单源(single source) :给定一个源结点u,找出从u到G中所有可达结点之间的最优路径。-局部传递闭包(partial transitive closure)问题。所有对 (all pairs):在G中找出y的所有结点u和v之间的最优路径。-有关传递闭包的问题。10、 图遍历的含义,图遍历的方法-Breadth first search和Depth first search答:图遍历(graph traversal)算法是所有路径查询的计算根底,它沿着图的边,通过从一个结点到另一个结点的遍历来搜索路径。路径搜索是一个递归的操作,需要不断把结点的邻接表从磁盘读到内存缓冲区中。所以,为了使图操