《空间数据的采集和质量控制第3节地理实体数据的编码.ppt》由会员分享,可在线阅读,更多相关《空间数据的采集和质量控制第3节地理实体数据的编码.ppt(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3节 地理实体数据的编码一、属性数据的定义 地理实体数据的编码指的是地理实体中属性数据的编码 1、属性数据的含义是指描述实体数据的属性特征的数据 如道路的宽度、等级、表面类型、建筑方法、建筑日期、特殊的交通规则、车流量等 当属性数据的数据量较大时,通常与几何数据分开输入,并存储在数据库 中,通过惟一的标识符与相应的几何数据联系起来 在属性数据中,有一部分是与几何数据的表示密切有关的(如道路的等级、类型等,它们决定着道路符号的形状、色彩、尺寸等),在G1S中,通常把 这部分属性数据用编码的形式表示,并与几何数据一起管理起来。编码的过程是将信息转换成数据的过程,前提是首先要对需表示的信息进行分类
2、分级第3节 地理实体数据的编码二、属性数据的分类分级 分类,是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程 分级,对事物或现象的数量或特征进行等级的划分,主要包括确定分级数和分级界线。1、分类的基本原则 分类的基本原则是:科学性 选择事物或现象最稳定的属性和特征作为分类的依据。系统性 应形成一个分类体系,低级的类应能归并到高级的类中。可扩性 应能容纳新增加的事物和现象,而不至于打乱已建立的分类系统。实用性 应考虑对信息分类所依据的属性或特征的获取方式和获取能力。兼容性 应与有关的标准协调一致。第3节 地理实体数据的编码二、属性数据的分类分级2、分类的基
3、本方法 线分类法(层次分类法)面分类法 线分类法将初始的分类对象按所选定的若干个属性或特征依次分成若干个层级 目录,并编排成一个有层次的、逐级展开的分类体系。其中,同层级类目之间存在并列关系,不同层级类目之间存在隶属关系,同层类目互不重复、互不交叉。优点:容量较大,层次性好,使用方便;缺点:分类结构一经确定,不易改动,分类层次较多时,代码位数较长。面分类法将给定的分类对象按选定的若干个属性或特征分成彼此互不依赖、互不 相干的若干方面(简称面),每个面中又可分成许多彼此独立的若干个类 目。该的分类结果在应用时,可根据需要将面中的类目组合在一起,形成复合类目 优点:是具有较大的弹性,一个面内类目的
4、改变,不会影响其他面,且适应性强,易于添加和修改类目 缺点:是不能充分利用容量。第3节 地理实体数据的编码二、属性数据的分类分级 3、分级的基本原则 分级数应符合数值估计精度的要求 分级数多,数值估计的精度就高。分级数应顾及可视化的效果 等级的划分要以图形的方式表示出来,根据人对符号等级的感受,分级数应在47级。分级数应符合数据的分布特征 对于呈明显聚群分布的数据,应以数据的聚群数作为分级数。在满足精度的前提下,应尽可能选择较少的分级数 第3节 地理实体数据的编码二、属性数据的分类分级 4、确定分级界线的基本原则 保持数据的分布特征 使级内差异尽可能小,各级代表值之间的差异应尽可能大。在任何一
5、个等级内都必须有数据,任何数据都必须落在某一个等级内 尽可能采用有规则变化的分级界线 分级界线应当凑整第3节 地理实体数据的编码二、属性数据的分类分级 5、分级的基本方法 在分级时,大多采用数学方法,如数列分级、最优分割分级等 对于有统一的标准的分级方法时,应采用标准的分级方法 如按人口数把城市分为特大城市、大城市、中等城市、小城市等 也可以定性地分级,如国家、省、市、县、镇等第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 代码,是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础
6、。1、代码的功能 鉴别 代码代表对象的名称,是鉴别对象的惟一标识。分类 当按对象的属性分类并分别赋予不同的类别代码时,代码又可作为区分分类对象类别的标识。排序 当按对象产生的时间、所占的空间或其他方面的顺序关系排列 并分别赋予不同的代码时,代码又可作为区别对象排序的标识。第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 2、编码的基本原则 惟一性 一个代码只惟一地表示一类对象。合理性 代码结构要与分类体系相适应。可扩性 必须留有足够的备用代码,以适应扩充的需要。简单性 结构应尽量简单,长度应尽量短。适用性 代码应尽可能反映对象的特点,以助记忆。规范性 代码的结构、类型、
7、编写格式必须统一。第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 3、代码的类型是指代码符号的表示形式,有数字型、字母型、数字和字母混合型三类 数字型代码,是用一个或若干个阿拉伯数字表示对象的代码。特点:结构简单、使用方便、易于排序,但对对象的特征描述不直观 字母型代码,是用一个或若干个字母表示对象的代码。特点:比同样位数的数字型代码容量大,还可提供便于识别的信息,易于记忆,但比同样位数的数字型代码占用更多的计算机空间。数字、字母混合型代码,是由数字、字母、专用符组成的代码。特点:代码兼有数字型和字母型的优点,结构严密,直观性好,但组成形式复杂,处理麻烦。第3节 地理
8、实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 4、GIS中代码的种类可以分为两种,一种是分类码,另一种是标识码。分类码,是根据地理信息分类体系设计出的各专业信息的分类代码,用以 标识不同类别的数据,根据它可以从数据中查询出所需类别的 全部数据。标识码(亦称识别码),是在分类码的基础上,对每类数据设计出其全部或主 要实体的识别代码,用以对某一类数据中的某个实体(如一个居民 地、一条河流等)进行个体查询检索,从而弥补分类码不能进行个体 分离的缺陷。标识码是联系实体的几何信息和属性信息的关键字。第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 5、编码方法举例 行政区划代码(GB226091)是一种识别码 用 6 位数字代码按层次分别表示:例如,南京市的代码为320101 连云港市的代码为320701 东海县320722 灌云县320723 赣榆县320721 灌南县320822三、属性数据的编码确定属性数据代码的方法和过程 5、编码方法举例 加拿大数字地形要素分类编码系统一种分类码,且是数字字母混合代码 采用树型结构将地形要素分为四级,其代码结构为:X X X X X X X X X 四级代码,三位数字 三级代码,三位数字 二级代码,两位数字 一级代码,一位数字第3节 地理实体数据的编码