《地理语义.docx》由会员分享,可在线阅读,更多相关《地理语义.docx(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章 语义 Web1 语义 Web 的背景和意义1.1 语义 web 消灭的背景1.1.1 背景Tim Berners-Lee 提出了语义Web1的 宏大设想。简言之,语义Web 就是能理解人类语言的智能网络,可以使人与计算机之间的沟通变得很轻松。1.1.2 语义 web 概念通过将Web 内容的语法构造和语义以学问表示形式显示地表示出来,以实现与其它信息源共享,使得人之间、人和机器之间以及机器与机器之间能准确地相互理解,从而实现最大程度的互操作性。1.1.3 语义 web 消灭的缘由和可解决的问题1.1.4 语义 Web 的主要功能语义Web 要能顺当工作,就要求计算机能构造化地组织信息和
2、规章集合,以使计算机利用规章进展自动推理。1.1.5 语义 Web 的根本构造语义Web 体系构造是一个七层模型,其构造如图1 所示。URI全球命名模式XML层作为语法层RDF层作为数据层本体层(Ontology Layer)作为语义层规律层(Logic Layer)供给了基于本体层上的智能推理规章证据层(Proof Layer)支持代理间通讯的证据交换。一个本体描述了一个特定争论领域的一个形式化的、共享的概念化模型。本体格外适合于描述互联网上各种不同的、分散的、半构造化的信息资源。通过定义共享的、通用的领域理论,本体帮助人和机器明确的沟通,支持语义级的交换,而不仅仅是语法级的。规律层供给了规
3、章与推导方法,从而便于在本体层上进展推理,得到有用的语义信息。从肯定的程度上讲,本体层定义的是否合理直接关系到推理的难易和结果的有效性。而证据层则在此根底上使代理可以交换推理的结果。为了检查这些结果,需要将各代理的内部推理机制转化为一种通用的证据表示语言。比方,某个在线效劳找到了李小姐的联系信息,而令人惊异的是她在上海。固然,你要核对一下,所以你的计算机让效劳来证明它的答复,效劳马上将其内在的推理理由翻译成语义网络的统一语言,你计算机中的界面引擎证明白这个李小姐确实符合你的查询要求,假设你还有疑问,它能显示出相关的网页。语义网构造中的数字签名和确信(Trust)则是为了保证信息交换的安全问题而
4、设计的,信息交换的双方必需建立了一种信认关系才能在肯定程度上保障信息的有效性。Berners-Lee 是World Wide Web Consortium (W3C) 的理事,以及麻省理工学院计算机科学试验室的争论员,他致力与互联网技术的争论很多年,提出了语义网抱负的层次模型1.2 语义 Web 的意义2 语义 Web 的关键技术2.1 XMLXML 作为一种资源描述语言,由于其良好的可扩展性和敏捷性,适合于表示各种信息,因而被广泛承受,已被认为是将来 Web 上数据交换的标准。XML 不仅供给对资源内容的表示, 同时也供给资源所具有的构造信息。但是,从便利信息搜寻的角度看来,仅有XML 是不
5、够的。2.2 RDF 与 RDF Schema一种用来描述数据的标准语法。是 W3C 推举的用于描述和处理元数据的一个草案,能为Web 上的应用程序之间交互供给机器能理解(处理) 的信息。它独立于任何语言,适用于任何领域,是处理元数据的根底。2.3 本体(Ontology)本体概念本体是哲学上的概念,从哲学上讲本体就是客观现实的抽象本质。人工智能领域,本体是指给出构成相关领域词汇的根本术语和关系,以及利用这些术语和关系构成的规定 这些词汇外延的规章的定义。计算机领域对本体最流行的定义就是概念模型的明确的标准说明。本体的目标本体的目标就是猎取相关领域的学问,供给对该领域学问的共同理解,确定该领域
6、内共同认可的概念及其 属性,并从不同层次的形式化模式上给出这些概念和概念之间相互关系的明确定义。本体应用中的目的人类、数据库和应用软件使用本体来共享领域学问(一个领域是指一个特定的学科范围或者学问范围,例如医药、设备制造、房地产、汽车修理以及财务治理等)。本体既包括一个领域内的学问也包括各种领域之间的学问,使用这种方式使学问被重用。本体的描述语言和技术本体描述语言有很多,如:RDF(S)、OIL、DAML、DAML+OIL、OWL、SHOE 和XOL 等。另外,开发本体的工具有很多,如KAON OntoMat SOEP、OntoEdit、Ontolingua、Protg 等。在语义网中,Ont
7、ology 具有格外重要的地位,是解决语义层次上 Web 信息共享和交换的根底。2.4 现实世界-实体的角色-表达格式图说明白现实世界的表达(数据,元数据和本体),实体的角色(事实,定义和学问),表达格式(XML,RDF,DAML+OIL 和 OWL),以及语法(syntax),模式 (schematics)语义(semantics)这些概念之间的关系。XML 层是数据表示的语法层, RDF 层是元资料层,本体层是在元数据层根底上构造领域学问。实现地理信息效劳,需要解决三个层次上的问题,即地理认知不同所引起的问题、对 地理认知的描述方式不全都的问题和数据层次上的问题。借助于本体,能够明确地理信
8、息 的语义信息,解决由于地理认知不同所引起的问题及其规律描述的互译问题,从而到达学问层面上的地理信息效劳。3 语义 Web 的具体应用3.1 智能信息检索与语义搜寻(地理实体学问搜寻)存在问题和问题缘由面对Web 上的海量信息,传统的Web 信息表示方法使信息检索的查准率和查全率均不抱负。根本缘由在于当今万维网的信息主要是基于语法构建的,因此要改进信息检索的效果,就必需对万维网上的信息进展语义标记。语义Web 技术解决该问题方法和关键技术供给这一机制就是本体。本体的构建需要领域学问专家的参与。从当代WWW 上保存的大量一般Web 页面中提取出语义信息,构建出页面内容的本体,然后依据本体对的页面
9、进展语义标记,这是一种可能的途径。实现这一过程可承受本体自学习系统,从而实现本体的自动或半自动猎取。文本信息可以承受语义Web技术, 结合模式识别和对象提取等技术,实现基于本体概念的检索。语义web解决问题的实例方案现有的搜寻引擎是基于关键字的3,关键词的多义性和同义性降低了搜寻的准确性,在搜寻时通常会找到 大量的与目标无关的内容。如搜寻“老泰山”,可能返回大量与泰山有关的页面,而这与用户的本意相差太远。语义Web 技术能依据准确的概念、学问构造和推理规章进展搜寻,从而得到与用户目标比较接近的结果。如上例返回的结果就肯定是与“岳父”有关的信息。3.2 个人和企业的学问治理语义空间数据共享、建库
10、或者 语义空间数据模型存在问题和问题缘由过去的学问治理面对的是存放于文件或是数据库中的学问。当学问库规模不断扩大,学问的检索和处理也 就开头变得低效;而且,不同的异构数据源之间也很难达成数据共享。语义Web 技术解决该问题方法和关键技术通过语义Web 技术,特别是借助于本体(Ontology)和机器可处理的元数据(Metadata),对学问进展准确的语义标注之后,这为学问治理由更多的面对文件的观点转化为更多的面对学问工程的观点铺平了道路。实现异构数据源的学问共享不再是难事。解决数据共享的模式解决数据共享的模式大致有三种:数据格式转换模式、直接数据访问模式和数据互操作模式2.对于数据格式转换模式
11、,由于缺乏对数据对象统一的描述方法,不同数据格式描述空间对象时承受的数据模型不同,因而转换后不能完全准确地表达原数据的信息,常常性地造成一些信息丧失,且各转换方案还没有为数据的集中和分布式处理供给解决方案,不能自动同步更. 直接数据访问供给了一种更为经济有用的多源数据共享模式,但直接数据访问同样要建立在对要访问的数据格式的充分了解的根底上,假设要访问的数据的格式不公开,就难以实现了.3.3 基于 Ontology 的智能信息 Agent分布式 Agent 空间数据计算和学问猎取存在问题和问题缘由面对Agent 的计算能帮助人们在简单、异构、不确定的信息环境中识别简单模式。可是,由于Agent
12、难以理解和处理自然语言描述的数据4,它不能充分发挥其优势。语义Web 技术解决该问题方法和关键技术语义Web 为智能Agent 供给了很好的语义环境,假设由智能Agent 存取Web上的信息,语义Web 的本体库就显得很有用了,它允许Agent处理本体中的概念和一组推理规章,这提高了Agent处理信息的准确性。语义web解决问题的实例方案搜寻Agent 可以只搜寻指向准确概念的那些Web 页面,而不是含有具有歧义的关键词的全部页面。更高级的Agent 将依据本体自动把Web 页面信息关联到相关的学问和规章,觉察并猎取Web 上的有用信息。3.4 语义 Web 效劳语义Web在Web效劳中的用途
13、语义Web 效劳是将语义Web 技术应用到Web 效劳领域,实现Web 效劳的自动觉察、调用和合成。Web效劳使用语义Web的条件然而,这种假设基于两个前提5:第一,所引用的Ontology 支持自动推理;其次,智能Agent 能够理解Ontology 中的概念。要实现这两个前提需要基于描述规律的本体形式语言如OWL和标准的、更高层次的本体如基于OWL的框架OWL-S6-7以使本体所表达的语义得到统一。常用的描述Web效劳的语义语言OWL 是一种定义和实例化“Web 本体”的语言。OWL 供给了3 种表达力量递增的子语言OWL Lite、OWL DL 和OWLFull,以分别用于特定的实现者和
14、用户团体。OWL Lite 用于供给应那些只需要一个分类层次和简洁约束的用户,OWL DL支持那些需要最强表达力量的推理系统的用户,OWL Full 支持那些需要尽管没有可计算性保证,但有最强的表达力量和完全自由的RDF 语法的用户。在OWL-S中,一个效劳由3 个局部来描述:ServiceProfile、ServiceModel 和ServiceGrounding。ServiceProfile 说明效劳是干什么的,ServiceModel 说明效劳是怎么做的,ServiceGrounding具体地说明白该如何访问效劳。3.5 语义 Web 挖掘语义Web挖掘的优势语义Web 挖掘8 旨在将W
15、eb 挖掘和语义Web 这两大争论领域结合起来,使其相互促进、共同进展。一方面,Web 挖掘的结果有助于构建语义Web;另一方面,语义Web 的语义学问使得Web 挖掘更易实现,同时能改善Web 挖掘的结果。语义Web挖掘的根本执行过程语义Web赐予传统的WWW形式化的语义学问,从而为丰富传统的Web挖掘奠定了良好的根底。在语义Web 中超链接通过显式的方式表达出来,这使得学问工程师须对Web构造进展更进一步的挖掘;同时,Web 页面内容具有了明确的语义要求能够承受更加构造化的数据输入的Web 挖掘技术。相应地,语义Web 挖掘分为:语义Web 内容及构造挖掘和语义Web 使用记录挖掘。3.6
16、 语义网格语义网格消灭背景在英国的e-Science打算争论中,人们觉察,网格的现有努力和e-Science 设想之间存在差距,要到达e-Science 的易用性和无缝自动化要求,必需实现尽量多的机器可处理性和尽量少的人类介入,这和语义Web 的目标有肯定的相像。语义网格概念在2023年最先提出了语义网格的设想,并于2023 年在全球网格论坛GGF 成立了语义网格争论组SEM-GRD。语义网格小组对语义网格进展的定义如下9:语义网格就是“对当前网格的一个扩展,其中对信息和效劳进展 了很好的定义,可以更好地让计算机和人们协同工作”。可以说语义网格是网格在语义力量上的扩展;从另一个 角度也可以说语
17、义网格是语义Web对计算力量的扩展。语义网格设想的关键之处就是把全部的资源,包括效劳, 都用一种机器可处理的方式来描述,其目标是实现语义的互操作性。实现语义网格方法到达这个目标的一种实现方法是把语义Web 的关键技术应用到网格计算的开发中,下至根底设施上至网格应用。语义网格通过将网格上的信息进展更好的形式化描述以使计算机尽可能取代人进展网格上信息处理,从而 让诸如电子商务、电子政务、数字图书馆等智能化效劳在网格上开展成为可能。当前争论状况中国科学院计算技术争论所学问网格争论组在诸葛海争论员的带着下正在开展语义网格方面的争论。重点 解决3个方面的问题:资源的标准组织、语义互联和智能聚合。3.7
18、对等计算(P2P)P2P1与0语义Web 技术结合的优势P2P10与语义Web 技术的结合可支持分散的异构的环境,可用较小的努力来共享学问,学问共享和觉察比较简洁。P2P10与语义Web 技术结合关键技术它们能否结合成功的关键在于“即时语义”的使用。“即时语义”建立在轻载的或重载的本体上,这些本 体由不同的个人、部门或组织创立。为了能为不同的个人或组织提取共享的本体,“即时语义”考虑了本体定义、概念的使用、与实际数据的关系之间的重叠。智能代理将使用这样的定义来确保学问被适当地构造,以便能轻易地被重用。3.8 电子商务存在问题和语义 Web 可解决内容传统的电子商务存在很多问题:掌握问题、信息觉
19、察问题、环境问题、兼容性问题和智能问题等。在电子 商务应用中引入语义Web 技术能在肯定程度上解决上述问题。争论状况目前国内外对语义Web 技术在电子商务中应用的争论11主要集中在描述语言、基于本体的企业商务集成方法与架构(用户需求或产品或企业商务过程的语义描述、本体映射、Web 效劳觉察与组合、电子商务集成框架)、领域本体的治理(包括电子商务本体构建、本体库的治理)、CRM、电子交易、企业学问治理等方面。3.9 电子政务语义Web 技术在电子政务中的优势在电子政务建设中,充分利用语义Web 赐予Web 资源更明确、更完善的语义,使得在政府不同部门之间、公众与政府之间对词汇的表示达成全都的同时
20、,机器也能够理解Web 上的内容并实现不同政务系统之间的协同工作。同时,语义Web给智能Agent 和Web 效劳供给了语义信息和必要的推理机制,这使得电子政务平台在分布式的环境下具有良好的智能,各种政务应用能够无缝地进展语义互操作,抑制现有电子政务平台的一些缺乏。语义Web 技术在电子政务中可解决的问题语义Web 技术对电子政务的影响主要有:解决电子政务中标准化问题,供给智能的查询效劳,供给一站式效劳,实现语义互操作和政务智能以及实现有效的学问治理等。3.10 语义门户传统门户的问题传统门户是基于传统Web 技术建筑的,以人为使用对象,而传统Web 技术在信息的搜寻、访问、提取、注释和处理方
21、面表现出很大的局限性,如缺乏对Web 上信息的描述。HTML 供给的链接缺乏语义,基于关键词检索的查准率低下,从而限制了门户网站对信息共享和通信的支持。语义门户的优势语义门户12是语义Web技术驱动的门户网站,它是实现具有共同兴趣目标的用户之间的信息沟通和共享的平台。语义门户使用语义Web 技术来供给语义检索、扫瞄和内容集成,语义Web标准为这种门户的设计开创了思路。尤其是它可以为人们如何提醒门户信息供给相关标准;RDF 的消灭使得信息项及相关元数据具有了敏捷的、可扩展的格式;OWL 能够明确提醒对信息项进展分类与建构的领域本体。同传统门户相比,使用语义Web 标准进展门户设计具有以下优点:多
22、维检索和扫瞄、信息构造的演化和扩展、领域扩展、跨学科门户整合等。已有一些建成的语义门户实例目前在国外已有一些建成的语义门户,比方OntoWeb、Esperonto、Empolis K42、Mondeca ITM、SWWS、ITM、Mindswap、OntoWebEdu 等,而在国内尚少。创立语义门户的方法和框架也有很多,比方SEAL、ODESeW、K42、ITM、OntoWebber、Onto-Weaver 等。这些方法各有其特点,奥地利的Holger Lausen 等人建立了一套评价体系,并对上述的前4 种方法作了比较具体的比较和评价。其次章 基于本体的空间信息集成与共享技术1 空间信息共享
23、存在的问题1.1 空间数据组织治理方式空间数据组织治理方式具有很大的差异性表现在属性字段组织、空间索引、数据存储方式等方面。空间数据属性构造千差万别,不同的应用领域、不同的部门行业等都有不同的数据需求,专题空间数据构造也会依据实际应用进展重定义、重组织。空间数据库在组织设计阶段就已经产生了概念化的异构空间数据的索引方式也是多种多样,目前主流的索引方式包括格网索引、四叉树空间索引、 R 树和 R+树索引等,不同的 GIS 厂商承受不同的索引方式,如 ESRI 公司的空间数据库引擎ArcSDE 承受的是网格索引方式。1.2 空间信息的异构性目前,参与共享的空间信息资源具有分散和异构特点。空间数据信
24、息来自不同的部门、不同 的组织,分布于各业务部门各自的计算机上,对应各自的应用和治理系统具有不同的构造。空间信息资源在这些方面存在异构性特点。它们从概念分类、应用性质、猎取手段上都具有很大的差异性。根本的数据模型基于矢量模型表达和基于栅格模型表达两种具体到各个应用部门,针对不同的业务需求,不同的地理空间数据承受不同的地图投影和地理坐标系统,造成空间数据参考信息的差异性。异构主要表现在:l 数据内容和数据源l 空间数据模型表达机制、l 空间数据格式、l 空间参考信息、l 空间数据存储方式、l 支撑软件平台1.3 空间数据库在设计过程中产生的概念化异构1.4 空间信息缺乏语义描述l GIS 主要侧
25、重表达地理特征的几何成分,语义关系不被重视,对现实世界空间几何目标的抽象无视了地理现象的本质特性及现象之间的内在联系,削减了信息容量;l 留意空间位置描述的矢量或栅格数据组织模型,丧失了以分类属性和相互关系为根底的构造化实体所供给的丰富的分析力量。l 基于专题地理分层的空间数据表达思想和单一图层内以矢量或栅格数据构造根本单元作为地理实体或现象根本建模单元的表达方式,对于简单地理实体或现象的描述及地理过程分析存在严峻缺乏。l 这就使已有的地理信息系统成了功能层次较低的空间数据存贮和治理系统,难以进展较高层次的空间分析和关心决策。无视语义关系会使人们在己有的认知水平上对原本为有机整体的地理世界进展
26、僵硬的分割,从而导致基于这种生疏的 GIS 在简单的、深层次的空间分析上显得被动。1.5 对空间学问理解差异导致语义异构l 由于人们对各自领域内空间信息认知的不同,导致对同一地理现象观看描述会侧重于对象不同的切面,从而产生观点上的差异,形成语义异构。l 由于现有的空间数据模型多是从计算机表达的角度动身,而不是面对真实地理环境,所以缺少对领域内空间地理实体或现象的显式定义和根底关系描述,不能在语义层次上实现数据的共享。2 空间信息集成共享进展阶段(1) 文件治理模式阶段空间信息互操作与数据共享主要通过数据格式转换来实现,存在的问题是数据格式相互封闭、空间数据在转换过程中会有信息丧失、效率很低下等
27、 ,因此,无法解决空间信息共享问题。(2) 空间数据库治理模式阶段通过把图形与属性数据同时存放于对象关系数据库中或通过空间数据库引擎 (SDE)来存入关系型数据库实现数据与信息的共享,由于不同的 GIS 软件平台所承受的数据库存储格式与空间索引方式仍旧不一样,因此,也不能从根本上解决空间数据共享集成问题;(3) 元数据信息交互模式阶段通过抽取空间数据的元数据信息, 供给对空间数据的名称、来源、组织构造、适用范围等特征描述,利用空间数据元数据建立的空间信息的数据名目和数据交换中心 实现对数据的觉察、猎取、理解,从而实现空间信息的共享集成利用,但共享仅限于语法层次,无法满足基于语义的共享集成。(
28、4 ) Ontology 驱动的空间信息共享与互操作阶段一代 Web ( Semantic Web )消灭了,它试图在语义与学问的层次上实现互联网上资源的全面连通交互与共享,特别是 Web 信息或学问等资源语义级的准确表达、共享与互操作。研发支持语义环境下空间信息与学问互操作的关键机制与技术已成为必定。现在,在语义层次上 的学问与信息互操作核心技术方面,人工智能(AI )与学问工程(KE)领域的 Ontology 理论与技术己经成为国内外相关争论的主流,很多争论者或机构已经开头了基于 Ontology 的信息与学问系统集成方法(Ontology Based Information System
29、 Integration ) 争论,并己经取得阶段性成果;Web 环境下语义层次的空间信息或学问互操作与共享争论也己经开头,并且也引入了基于 Ontology 的 GIS 集成方法争论。争论实践说明,Ontology 技术将对语义化 Web 环境下的空间信息集成共享起到关键性作用。3 本体的构建3.1 本体Ontology概念及目标上世纪 70-80 年月信息科学特别是计算机科学开头了对自然世界认知的形式化的表示的争论,也就是可被计算机表示,解释和利用的学问的形式化争论。范畴提出时间/提出人定义哲学客观存在的一个系统的解释和说明,客观现实的一个抽象本质1991/Neches 等给出构成相关领域
30、词汇的根本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规章的定义计算机1993/Gruber概念模型的明确的标准说明1997/Borst共享概念模型的形式化标准说明1998/Studer共享概念模型的明确的形式化标准说明Ontology :通过对概念的严格定义和概念与概念之间的关系来确定概念准确含义,表示共同认可的、可共享的学问。共享概念模型的明确的形式化标准说明:1. 概念模型conceptualization通过抽象出客观世界中一些现象Phenomenon的相关概念而得到的模型,其表示的含义独立于具体的环境状态2. 明确explicit所使用的概念及使用这些概念的约束都有明确
31、的定义3. 形式化formalOntology 是计算机可读的。4共享shareOntology 中表达的是共同认可的学问,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。Ontology 的目标Ontology 的目标是捕获相关的领域的学问,供给对该领域学问的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇术语和词汇之间相互关系的明确定义。不同的系统描述领域的时候使用不同的概念和术语。所以很难从一个系统中提取学问运用到另一个系统中。开发可重用的 Ontology 以推动共享和重用是 Ontology 争论的一个重要目标。3.2 Ontology 的建模
32、元语五个根本的建模元语(Modeling Primitive) 类(classes),概念(concepts): 概念的定义一般承受框架(frame) 构造,包括概念的名称,与其他概念之间关系的集合,以及用自然语言对该概念的描述。 关系(relations) :关系代表了在领域中概念之间的交互作用。形式上定义为n 维笛卡儿乘积的子集: R : C1 C2Cn 。如:子类关系( subclass-of) 。 函数(functions) :函数是一类特别的关系。在这种关系中前n - 1 个元素可以惟一打算第 n 个元素。形式化的定义如下: F : C1 C2 Cn-1 Cn 。例如Mother-o
33、f 关系就是一个函数,其中Mother-of ( x , y) 表示y 是 x 的母亲,明显x 可以惟一确定他的母亲y 。 公理(axioms) :公理代表永真断言,比方概念乙属于概念甲的范围。公理可以看作是Ontology 中的约束 实例(instances) :实例表示的就是对象,而概念表示的则是对象的集合,关系对应于对象元组的集合。实例是本体中的最小对象。具有原子性,即不行再分性。假设某个实例还可以再进展划分,那么它就是一个类,而不是实例。根本的关系有 4 种:part-of ,表达概念之间局部与整体的关系。kind-of ,表达概念之间的继承关系,类似于面对对象中的父类与子类之间的关系
34、。instance-of ,表达概念的实例与概念之间的关系,类似于面对对象中的对象和类之间的关系。attribute-of 。表达某个概念是另一个概念的属性。如“价格”是桌子的一个属性。在实际的应用中,不肯定要严格地依据上述 5 类元语来构造 Ontology。同时概念之间的关系也不仅限于上面列出的 4 种根本关系,可以依据特定领域的具体状况定义相应的关系, 以满足应用需要3.3 Ontology 的分类为了对 Ontology 进展有效的分类,Guarino 在文献15 中提出以具体程度和领域依靠度两维度作为对 Ontology 划分的根底。具体程度是相对的、较模糊的一个概念,指描述或刻画建
35、模对象的程度。具体程度高的称作参考(reference) Ontologies ,具体程度低的称为共享 ( share) Ontologies。依照领域依靠程度,可以细分为顶级 (top-level) 、领域 (domain) 、任务 (task) 和应用(application) Ontologies 等 4 类。顶级 Ontologies 描述的是最一般的概念及概念之间的关系,如空间、时间、大事、行为等等,与具体的应用无关,其他种类的Ontologies 都是该类 Ontologies 的特例。领域 Ontologies 描述的是特定领域(医药、汽车等) 中的概念及概念之间的关系。任务 O
36、ntologies 描述的是特定任务或行为中的概念及概念之间的关系。应用 Ontologies 描述的是依靠于特定领域和任务的概念及概念之间的关系。3.4 本体的构建共享学问明晰化、形式化的过程 有时隐性学问也会由此显性化构建准则Gruber,1995 清楚性clarity、明确性和客观性 完全性completeness 全都性coherence 最大单调可扩展性extendibility 最小承诺和最我码偏好minimal ontological commitment and encoding bias构建方法Protg 中建议的“七步法” 确定本体所在的领域; 考察是否可以重用现有本体;
37、找出领域中重要的类; 定义类和其间等级关系; 为类添加属性; 定义属性的分面; 创立实例本体并非一次就能建立好的,它是一个不断反复和循环的过程,需要依据具体应用而不断进展修正。参照目前相关领域的标准,并在领域专家的指导下进展核心概念的抽取;对抽取的核心概念进展分类;在分类的根底上抽取出它们之间的关系,构建一个组织良好规律关系严密的概念系统。在资源环境地理本体信息库抽取的整个过程中始终要有领域专家的参与,这是保证构建的资源环境地理本体信息库系统全面安康的关键。3.5 Ontology 与语义网参看第一章相关内容3.6 现实世界-实体的角色-表达格式图说明白现实世界的表达(数据,元数据和本体),实
38、体的角色(事实,定义和学问),表达格式(XML,RDF,DAML+OIL 和 OWL),以及语法(syntax),模式 (schematics)语义(semantics)这些概念之间的关系。XML 层是数据表示的语法层, RDF 层是元资料层,本体层是在元数据层根底上构造领域学问。实现地理信息效劳,需要解决三个层次上的问题,即地理认知不同所引起的问题、对地理认知的描述方式不全都的问题和数据层次上的问题。借助于本体,能够明确地理信息的语义信息,解决由于地理认知不同所引起的问题及其规律描述的互译问题,从而到达学问层面上的地理信息效劳。3.7 本体的用途Understand:沟通“what” kin
39、ds of objects are in the domain信息系统需要“代理”之间进展有效沟通,如何才能保障?本体使“代理”对于所在领域的生疏达成全都,为沟通供给语境Relate:集成“how” the objects are related信息系统需要处理大量分散化,异构,非构造化的信息,如何处理?本体在信息之间建立起机器可处理的联系,屏蔽资源层的差异。本体具有良好的概念层次构造和对规律推理的支持。通过建立各自的领域本体和基于本体的学问推理机制,对不同领域本体进展参比和映射,对这些异构系统进展集成,可以实现空间信息的集成和共享。Produce:推理“why” the objects ar
40、e related信息系统需要更多的智能化,自动化,如何实现?本体中的规章使得本体能够“无中生有”。 本体推理是计算机对本体学问理解的一种重要表现。使用本体的目的之一,就是想通过对本体的形式化描述,使得计算机能够理解本体所描述的学问,从而 “智能的”完成任务。本体的推理有多方面的应用: 对于本体的建立者,推理的主要作用是检测冲突,优化表达和本体融合; 对于本体的使用者,推理的作用主要是获得本体中的隐含的概念和关系,并运用这些隐含的概念和关系解决问题。推理方法l OWL DL 的语义基于描述规律(Description Logics),描述规律是一个学问表示语言的群体。它们专注于描述概念的语义(
41、semantics),因此很适合本体的推理。利用推理自动地在概念层次 (hierarchy)中分别出的概念,同时检查标准(specifications),消退冲突。l 描述规律是在命题规律(propositional logics)和一阶谓词规律(First order Logic)上进展起来的。命题规律的概念只能作为原子命题存在,表达力明显缺乏。而一阶谓词规律又由于表达力过强而导致相关的推理算法过于简单,无法有效地掌握推理时间, 它们都不适合用于建立本体。描述规律目的就是在表达力与推理简单度之间取得平衡。而且,描述规律可以较好的实施推理。推理有几种类型概念的可满足性推理,即推断一个概念是否有
42、实例使得它是可满足,比方 PointPath 这种概念就是不行满足的。概念之间的包含关系,point 这个概念是否包含在 multipoint 这个概念中。推断某个实例对象是否属于某个概念,比方“四川省”位于“中国西部地区”,推断 “四川省”是否在“中国” 。检索某个概念有哪些实例,比方检索在己有学问库中属于“中国西部省份”的有哪些实例。推断两个实例之间是否具有某个关系或者某种属性关联,比方“四川省”是否在“中国” 的西部?“四川省”的人口是否有“100,000,000”等等。还有一些其它的,包括这些的组合。其中两种是关于概念(类)之间的,是关于实例的。通常这些类型的推理都有可能用到。比方对于
43、信息检索来说,先是 推断某个信息(用户查询)是否属于某个概念,然后查看概念间具有什么样的关系,再就是逐一检索和推断两个实例之间是否具有某种关系。4 空间本体构建基于本体的空间信息共享集成即通过本体这一技术猎取、描述和表达空间信息领域的学问,实现不同个人、部门之间对空间信息学问的共同理解,并实现空间信息的共享集成。4.1 空间信息的语义表达l 在信息内容上,不仅要能够表达空间信息,更要人性化表达空间学问,符合人们认知习惯,用来支持空间信息解译自动化和智能化空间分析;l 在信息平台上,通过互联网络进展地理空间 Web 效劳,实现远程查找所需要的各种空间数据资源,进展各种空间信息分布式处理;l 在信
44、息的沟通上,从数据格式转换、信息共享进展到更智能化的、基于语义的互操作, 满足不同行业信息沟通的需要。4.2 地理信息的语义异构认知异质由于认知不同造成的异质同词异义。就是对于同样的真实地理世界有着不同的概念化,可以通过建立对应的地理名称之间的映射关系解决 。命名异质:由于命名冲突造成的异质同义异词。是指对于同样的地理概念使用了不同的名称。而对于认知异质,则要困难得多。以河流为例,同是一条河流,在运输部门看来它是一条运输航道,在旅游部门看来,它 是一个旅游景点。因此,运输部门要具体表示河流长度、宽度、深度、航道通行力量、水中 障碍物等与运输力量亲热相关的信息,而旅游部门可能关注的则是河水的水质
45、、沿河两岸的 名胜古迹等与旅游亲热相关的信息。这两个部门对河流的概念化有很大的差异,随之而来的 则是它们对于河流的表示从空间数据到属性数据都有很大的不同。假设在地理信息效劳当中, 要集成这两个部门的数据,不是简洁的通过数据格式转换或供给一种通用的数据格式就能解 决问题,本体论思想的引入为解决这一问题供给了的思路。4.3 地理本体Geo-Ontology及意义 地理本体论概念:是争论地理信息科学领域内不同层次和不同应用方向上的地里空间信息概念的具体内涵和层次关系,并给出概念的语义标识。 是有效解决异构空间信息猎取、描述、表达以及重用的理论技术体系, 通过争论空间信息的语义表达、共享和效劳描述和组
46、合,为空间信息供给具有计算机可以理解的语义,从而满足智能体对Web 上异构、分布信息的检索和访问,实现网上信息资源在语义层上的全方位互联,并在此根底上,为实现更高层的、基于学问的智能 应用奠定根底。引入地理本体的意义 为异构空间信息的共享供给了理论依据。利用本体技术理论猎取、描述、表达资源环 境空间信息领域的学问,供给对该领域学问的共同理解,确定该领域内共同认可的词汇, 并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。 促进来自于不同领域的争论人员之间的沟通、软件主体间的通信和互操作、异构数据源的集成等。实现不同个人、部门之间对资源环境空间信息学问的共同理解。 为空间信息集成与共享、空间数据挖掘、空间效劳互操作的问题供给了一条可行之路。使地理信息系统更加全面和深入地与各行各业的信息系统有机地融合