《数字化城市建设项目总体设计方案.docx》由会员分享,可在线阅读,更多相关《数字化城市建设项目总体设计方案.docx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数字化城市建设项目总体设计方案1.1.1 设计原则科学性科学性是判断事物是否符合客观事实的标准,富有科学依据。杭 州市域治理数字化系统的建设,需要从需求出发,遵循当前国家、省、 市各类相关政策文件精神,贯彻落实十八大以来习近平总书记六次政 法工作会议的讲话,深入领会社会治理社会化、法治化、智能化、专 业化水平的建设目标,结合杭州市打造“数字经济第一城”及市委政 法委市域治理“六和塔”工作体系的工作要求,确保系统建设的方向 性一直保持科学的路径,不断演化。1. 1. 1.2先进性当前,互联网、云计算、大数据、人工智能、物联网的快速发展, 促使社会治理信息化建设从传统走向现代,从机械走向智能,杭州
2、市 域治理数字化系统的建设,需要以省市电子政务的总体技术架构为基 础,结合本地业务诉求,充分借助前沿技术,提升平台功能、性能等 各类指标。1. 1. 1.3可靠性在整体设计中需确保系统的可靠性。系统集成选择当前成熟、先 进、容易管理及使用方便的系统,充分利用内存数据库技术、数据库 事务机制、数据交换规范等,减少数据出错和宕机几率,开发的功能 程可以互相连接、交叉或循环进行,也可以打破部门界限而发生于各 相关部门之间。传统的信息系统是基于任务的,活动之间的联系不能 自动进行,而工作流系统是针对过程的,它可以让多个流程依照规定 的规则自动“流动”,而变更流程设置相对容易。通过工作流管理系 统所提供
3、的流程定制工具,便可以迅速的搭建起面向具体业务的办公 环境,以及方便的增减和修改已定的业务内容和业务流程,并且能够 实现多项业务、多个部门的联合办公,特别是在传统业务模式中难以 实现的串联和并联审批的业务也可以方便的在网上得以实现。同时工 作流管理系统还提供系统日志,有利于事后分析和流程优化。1. 1. 4. 1. 5 地理空间信息共享平台地理空间信息发布共享平台建设基于SOA思想设计,坚持数据、 管理、服务、应用相分离的架构原则,在保持继承性、灵活性和扩展 性的前提下,创新大数据技术应用,实现时空地理信息数据的管理、 共享、融合和数据交换、知识引擎需求、智能装配。本系统在设计时,无论是数据组
4、织还是功能实现都以服务发布的 形式进行实现。平台基于C#+HTML 5+JavaScript开发,提供跨平台、 跨浏览的展示和应用,特别考虑智能移动终端的应用。数据库支持 Oracle Sqlservero硬件和网络环境依托主要依据杭州市电子政务 云平台。1.1. 4. 2杭州电子政务云平台技术4. 2.1RDS关系型数据库关系型数据库(Relational Database Service,简称 RDS)是 一种稳定可靠、可弹性伸缩的在线数据库服务。基于分布式文件系统 和 SSD 盘高性能存储,RDS 支持 MySQL、SQL Server PostgreSQL. PPAS (Postgre
5、 Plus Advanced Server,高度兼容 Oracle 数据库) 和MariaDB TX引擎,并且提供了容灾、备份、恢复、监控、迁移等 方面的全套解决方案,彻底解决数据库运维的烦恼。1.2. 4. 2. 2ADS分析型数据库分析型数据库MySQL版(AnalyticDB for MySQL),是海量数据 实时高并发在线分析(Realtime OLAP)云计算服务,使得您可以在 毫秒级针对千亿级数据进行即时的多维分析透视和业务探索。分析型 数据库MySQL版对海量数据的自由计算和极速响应能力,能让用户在 瞬息之间进行灵活的数据探索,快速发现数据价值,并可直接嵌入业 务系统为终端客户提
6、供分析服务。1. 1. 4. 2. 3 ODPS 数据仓库ODPS (Open Data Processing Service)是一种快速、完全托管 的GB/TB/PB级数据仓库解决方案,现在已更名为MaxCompute, MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企 业成本,并保障数据安全。1. 1. 4. 2. 4 SLB负载均衡负载均衡(Server Load Balancer)是对多台云服务器进行流量 分发的负载均衡服务。负载均衡可以通过流量分发扩展应用系统对外 的服务能力,通过消除单点故障提升应用系统
7、的可用性。1. 1. 4. 2. 5 OSS对象存储服务对象存储服务(Object Storage Service,简称OSS),是海量、 安全、低成本、高可靠的云存储服务。通过调用API,在任何应用、 任何时间、任何地点上传和下载数据,也可以通过Web控制台对数 据进行简单的管理。1.1. 4. 3数据处理技术4. 3.1 数据加工技术引入数据仓库构建技术,实现分散异构数据的汇聚和加工。该技 术主要具有以下功能特点:1)面向主题与传统数据库而向应用进行数据组织的特点相对应,数据仓库中 的数据是面向主题进行组织的。面向主题的数据组织方式,就是在较 高层次上对分析对象的数据的一个完整、一致的描述
8、,能完整、统一 地刻画各个分析对象所涉及的各项数据及数据间的联系。2)集成化特性数据仓库中的数据是从原有分散的数据库中抽取出来的,由于数 据仓库的每一主题所对应的源数据在原有分散的数据库中可能有重 复或不一致的地方,加上综合数据不能从原有数据库中直接得到。因 此数据在进入数据仓库之前必须要经过统一和综合形成集成化的数 据。3)随时间不断变化数据仓库中数据的不可更新性是针对应用来说的,即用户进行分 析处理时是不进行数据更新操作的。但并不是说,从数据集成入库到 最终被删除的整个数据生成周期中,所有数据仓库中的数据都永远不 变,而是随时间不断变化的。4)基于特定应用的业务数据关联一般的数据关联都是基
9、于特定的社会治理要素(如人、房、企等) 进行关联的过程,而在本项目中,通过梳理各特定应用的业务需求, 进行基于特定应用的业务数据之间的关联关系,为基层治理精细化、 智能化提供基础,创新应用。1. 1. 4. 3. 2 空间和地址数据关联融合以地理空间和统一地址为基础,将各类社会治埋要素赋予唯一的 统一地址编码,实现相互之间的关联查询。并通过空间关联,挖掘数 据之间的关联关系,实现社会治理要素数据的汇聚、入格、上图、发 布、共享;利用社会关系、管理关系以及服务关系等多重关联模型, 以各种社会活动和事件为链条、以人与政府、企业等组织的关系为联 系,将人与物、物与物的关系数据相互连接在一起,实现人与
10、人、人 与事、人与场所的动态关联融合。1. 1. 4. 3. 3 流媒体数据处理技术流媒体是指在网络中使用流式(streaming)传输技术进行传输 的连续时基媒体,如:音频、视频或多每一文件。传统的网络传输音 视频等多媒体信息的方式是完全下载后再播放,下载常常要花数分钟 甚至数小时。流式媒体在播放前并不下载整个文件,而只是将开始部 分内容存入内存,然后再开始播放。剩余的部分将在后台服务器向用 户终端进行连续、不间断地传送,一边传送一边播放,播放的数据也 不保留在用户终端的存储设备上。当网络实际数据接收速度小于播放 所消耗资源的速度时,播放程序就会取用缓冲内的数据,避免播放的 中断。之所以能这
11、样是因为在internet上数据是以包传输为基础的 断续异步传输,一个实时A/V源或存储的A/V文件在传输中要被分解 为多个包。由于网络是动态变化的,各个包选择的路由可能不尽相同, 故而到达客户端的时间延迟也就不等,甚至先发的数据包还有可能后 到。为此,使用缓存系统来减少延迟和抖动的影响,并保证数据包的 顺序正确,从而使媒体数据能连续输出,而不会因为网络暂时拥塞使 播放出现停顿。流媒体的传输原理如下图所示:RTSP/SHWDPCrCP)通常高速缓存所需的容量并不大,因为高速缓存使用环形链表结 构来存储数据,通过丢弃已经播放的内容,流可以重新利用空出的高 速缓存空间来缓存后续尚未播放的内容。流媒
12、体实现的关键技术是流式传输,实现流式传输有两种方式: 顺序流式传输(progressive streaming)和实时流式传输(realtime streaming)o顺序流式传输是顺序下载,在下载文件的同时用户可以观看,但 是,用户的观看与服务器上的传输并不是同步进行的,用户是在一段 延时后才能看到服务器上传出来的信息,或者说用户看到的总是服务 器在若干时间以前传出来的信息。在这过程中,用户只能观看已下载 的那部分,而不能要求跳到还未下载的部分。顺序流式传输比较适合 高质量的短片段,因为它可以较好地保证节目播放的最终质量。在实时流式传输中,音视频信息可被实时观看到。在观看过程中 用户可快进或
13、后退以观看前面或后面的内容,但是在这种传输方式中, 如果网络传输状况不理想,则收到的信号效果比较差。1. 1. 4. 3. 4 数据共享交换技术本项目将建设通用的数据交换平台,以国家目录体系与交换体系 标准为基础,全面实现了国标要求的功能,因此可以与其他目录系统 进行互联互通。在技术层面上,使用了 SOA架构,以服务方式提供功能调用,当 规则变化时,仅需调整相应的服务即可,而无需调整基础架构。同时,使用XML作为数据存储方式,极大地提升了系统的扩展性, 业务规则以XML方式组织,而非以关系型方式进行建模后组织,因而 业务规则的变化不会导致系统数据模型的变动,使数据交换平台能很 便捷地使用新的业
14、务规则。1.1. 4. 4数据分析技术1. 1. 4. 4.1 数据挖掘技术数据挖掘就是从大量的、不完全的、有噪声的、模糊的、隐含的、 尚不为人所知的随机的实际应用数据中,提取隐含在其中的、人们事 先不知道的、但又是潜在有用、有效的、新颖的信息,建立计算机程 序,自动在数据库中细察,以发现规律或者模式。其中,原始数据可以是结构化的,如关系数据库中的数据;也可 以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的 异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可 以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查 询优化,决策支持和过程控制等,还可以用于数据自身的维
15、护。1. 1. 4. 4. 2 空间分析技术空间分析是对于地理空间现象的定量研究,其常规能力是操纵空 间数据使之成为不同的形式,并且提取其潜在的信息。空间分析是 GIS的核心。空间分析能力是地理信息系统区别与一般信息系统的主 要方面,也是评价一个地理信息系统成功与否的一个主要指标。空间分析是GIS的核心和灵魂,是GIS区别于一般的信息系统、 CAD或者电子地图系统的主要标志之一。空间分析,配合空间数据的 属性信息,能提供强大、丰富的空间数据查询功能。因此,空间分析 在GIS中的地位不言而喻。空间分析主要通过空间数据和空间模型的联合分析来挖掘空间 目标的潜在信息,而这些空间目标的基本信息,无非是
16、其空间位置、 分布、形态、距离、方位、拓扑关系等,其中距离、方位、拓扑关系 组成了空间目标的空间关系,它是地理实体之间的空间特性,可以作 为数据组织、查询、分析和推理的基础。通过将地理空间目标划分为 点、线、面不同的类型,可以获得这些不同类型目标的形态结构。将 空间目标的空间数据和属性数据结合起来,可以进行许多特定任务的 空间计算与分析。1.1. 4. 5数据展示技术数据可视化是关于数据之视觉表现形式的研究;其中,这种数据 的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括 相应信息单位的各种属性和变量。数据可视化技术的基本思想是将数据库中每一个数据项作为单 个图元元素表示,大量的数
17、据集构成数据图像,同时将数据的各个属 性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数 据进行更深入的观察和分析。以下介绍几种单一展现效果:1、气泡图气泡图根据气泡大小、位置和颜色展现数据信息,如根据词语出 现的频度和时间维度进行展现,可用于展现搜索中各种搜索关键字的 检索频率和检索时间。2、力导向图力导向图展示各个点之间的关联关系和相关度,如可用于地址与 人、人与企业、人与事件等之间的关联关系。3、辐射图辐射图用于在一个圆内展示数据之间的关系,如可用于迅速从大 量事件通过地址、人、企业等关联中发现强关联性事件。4、圆形装填图圆形装填图通过圆圈的大小和归属表达明确的层级关系,可用于
18、 展现事件之间的聚类和关联关系。5、地理图通过地理图,可以展示地理信息相关的信息,如人的运行轨迹等, 地理图展现一般通过GIS实现。1. 1. 5系统性能设计5.1系统易用性设计1、界面总体风格一致,字体清晰;2、简化操作,简化操作步骤,对于复杂操作具有向导提示功能;3、优化图形显示,提供图形的展现效率。1. 系统高效性设计按照面向对象的软件设计思路进行设计和编码,系统将有针对性 地对SQL语句和存储过程进行严格的性能测试和优化,对一些耗时操 作进行算法优化,对网络数据进行实时连续的采集,从而实现节省流 量损失。同时充分利用云平台提供的负载均衡服务提升访问效率,降 低服务器访问高峰时段的运行压
19、力。1.1. 5. 3系统可靠性设计保障数据的一致性与完整性。对于输入的数据,为其定义完整性 规则,如果不能符合完整性约束,系统给出相应提示并拒绝该数据。保障数据的共享性与相对独立性。提供灵活的配置,使各个子系 统能够独立运行,而通过多种方法进行系统数据的交换,提供数据的 共享,也相应保证了系统的强壮性。1.2. 5. 4系统安全性设计系统部署在市电子政务云平台上,由云平台的安全保障体系对系 统的安全进行保障;对于系统应用安全性,提供了功能权限控制和数据权限控制双重 安全保障,对用户操作进行日志记录,并进行安全审计。1.3. 5. 5系统扩展性设计系统设计充分考虑扩展性。提供多种系统配置工具,
20、方便系统管 理人员对组织机构、人员、权限(功能和数据)、图层、搜索引擎、 分析模型等进行调整。同时,系统充分考虑到数据的扩展性,以满足 和技术路线需经过严密的测试验证,使系统能有很好的可靠性。1.1. 1.4成熟性按照工期要求,系统建设需要采用成熟可靠的技术方案,依托现 有产品,按照业务功能需求进行逐一比对,确认功能完整性和实用性, 从而在工作要求时限内,保质保量的完成项目交付。1. 1. 1.5经济性项目建设应当充分考虑项目预算的实际金额,从实用角度出来, 坚决杜绝华而不实的建设思路,并实现对现有信息化建设成果的充分 融合,保护现有投资,在合理的项目经费下,完成平台建设。2. 1. 1.6合
21、理性在项目需求调研、方案编制、可行性研究、平台开发部署测试上 线以及项目运维等过程中,应当充分考虑好各项工作的合理性,通过 建立标准化的项目管理规范和流程机制,实现整个项目管理过程的合 规,确保各项工作的开展,都遵循合理性的工作要求。3. 1. 1.7扩展性随着市域治理业务不断发展,计算机应用水平不断提高,信息技 术也日新月异,因而系统所选的应用软件、管理软件、软件总体设计 方法以及相应的硬件设备应具有良好的兼容性和拓展性,保证今后系 统的完善、扩展、升级和提高,其资源可重新得到利用。同时不同的 业务系统应具有开放的标准接口,能与其他系统之间建立良好有效的 无缝链接,使得系统具有良好的扩展余地
22、。平台的迭代升级以及支持二次开发。LL6系统接口设计6.1数据中心与外部数据源接口数据中心支持不同的接口方式与外部数据源对接。 WebService服务接口,应用于通过标准的WebService接口 服务进行业务交互场景;FTP服务,应用于通过文件方式进行数据交换的场景; Socket服务接口,应用于数据量大、实时性要求高的业务交 互场景;ETL服务,应用于通过数据库视图方式进行数据抽取场景;本项目与大数据资源共享平台以及综合指挥平台的对接采用ETL 服务方式进行。1.1. 6. 2数据中心与上层应用接口数据中心与应用系统的数据交互采用服务调用的方式。1.1. 6. 3数据纵向交互接口设计由市
23、综合信息指挥平台建立交换前置库,与数据中心人、房、企、 事件基础数据进行接口对接,前置库对输出及流入的数据进行标记, 综合指挥平台根据社会治理需求进行基础数据的统一分类和管理。区县数据由综合指挥平台原有业务通道实现数据上传。数据下发 共享则需针对市域治理数据中心提供的数据/块数据标准,以前置库 或定制接口的形式实现数据在市级与区县之间的上传下达。1.1. 6. 4聚合分析服务接口该服务接口面向空间、基础业务数据,以“房屋”为聚焦,基于 建立了多维嵌套关联关系的文档型对象,基于市域治理数据中心文档 聚合模型封装的数据服务接口,能够实现人口、房屋、企业、事件等 基础数据的聚合分析(包括空间与属性)
24、查询与明细查询。1. 1. 6. 5关系图谱服务接口关联图谱服务接口是基于市域治理数据中心关联图谱模型封装 的数据服务接口,能够实现人与房屋及其位置之间的关联查询,实现 房屋与楼栋所属关系查询,实现多级空间之间的所属关系查询,实现 法人与房屋及其位置之间的关联查询,实现人与法人之间的关系查询, 实现事件与多级空间之间的关联查询。地理空间信息发布共享平台1. 1. 6. 6. 1 与地理市情平台对接对接地理市情平台,实现电子地图、影像图、行政区划、道路、 水系、建筑物、绿地等基础测绘成果数据的接入。1. 1. 6. 6. 2 服务共享接口设计系统为市域治理相关单位及应用平台提供访问矢量数据的接口
25、, 实现矢量数据服务的获取。接口形式包括符合OGC WMS、WFS规范的 WMS接口和WFS接口。共享的数据包括:地名地址数据、建筑物数据 以及网格数据。同时,在基础设施扩容、与其它系统集成方面做到无缝对接和灵活扩展。1.1. 2总体架构设计在社会治理业务系统基础上,构建市级、区(县、市)、乡镇(街 道)三级市域社会治理业务应用体系;在城市大脑基础设施和各类智 能分析引擎群的支撑下,构建“1+5+1”安全风险防范体系。安全风险圈系统价系统“1”即一套安全风险防范搜索引擎。依托城市大脑算力和智力 支持,构建安全风险防范搜索引擎,实现风险和预警信息的抓取、社 会治理态势和领域安全风险分析。“5”即
26、五大领域安全风险防范系统。城市大脑在推进交通、城 管、警务等行业应用系统建设的同时,统筹推进行业安全风险防范模 块建设。通过若干个行业安全风险模块的聚合,进而形成涵盖政治、 经济、文化、社会、生态等五大领域的安全风险防范系统。“1”即一组考核评价模型。实现对各地各部门安全风险防范系 统推进情况、安全风险防范处置落实情况以及社会治理成效进行考核 评价。1. 1. 3平台架构设计大屏展示层大屏展示层市域治理全景视图市域治理数据视图市域治理应用视图1+5 + 1安全风险防范体系应用分领域安全风险防范系统数字治理考核评价系统业务应用层安全风险防范搜索引擎1政治 五大:J领域? 经济 x i2:风险i文
27、化螃tteL- J 通 交业全险范块成 行安风防模集 海冢爵w-Fi: 而蜜1E环3平安指数考核评价数据共享考核评价安全风险防范系统推迸情况考核评价安全风险防范)落实情况考核评价综合运维管理平台应用支撑层统一认证服务统一接口服务统一 GIS服务统一权限管理 统一消息服务数据运维体系 标准规危体系 信息安全体系数据资源层社会治理数据共享市域治理数据中心市域治理数据处理中心市域治理专题库市域治理数据应用中心基础设施层政务云平台基础网络(电子政务网、视联网、互联网)物理感知(物联网、衩濒监控)参照省政府数字化转型“四横三纵”七大体系建设要求,市域治 理数字化系统采用“五横三纵”的总体架构,依托市电子
28、政务云基础 设施和城市大脑算力算法资源进行建设。1. 1. 4技术路线本项目涉及相关技术比较多,主要分为基础平台技术、杭州电子 政务云平台技术、数据处理技术、数据分析技术和数据展示技术五类。1. 1.4.1基础平台技术1. 1.4. 1. 1 SOA体系架构面向服务的体系结构(service-oriented architecture, SOA) 是一种组件模型,它将应用程序的不同功能组件(服务),通过“服 务”之间的良好接口联系起来(也就是“服务”之间的松耦合)。接 口是采用中立方式进行定义的,独立于实现“服务”的硬件平台,操 作系统和编成语言。这是构建在各种各样系统中的“服务”可以以一 种
29、统一和通用方式进行交互。松耦合的好处是保证系统灵活性,另外, 还可以保证“服务”的重复利用。Web服务是目前实现SOA最重要的 标准。SOA是在原有组件化和EDI (电子数据交换)的基础上,进一步 将可重复利用的软件资源抽象化和标准化,换句话说,就是抽取软件 基因,建立互通的管道,达到重复利用和信息流畅的目的,解决业务 最头痛的“适应业务变化”和“集成”问题。与过去的组件化模式相 比,SOA的新奇之处还在于:它变过去的技术组件为业务组件(又叫 服务),强调的是技术无关性,关注的是实现怎样的业务功能一一在 业务请求与响应之间随时搭建快速通道,同时,变过去的紧耦合为松 耦合,既保证系统弹性,又不失
30、系统效率,进而实现重复利用软件资 源、快速响应市场需求变化、提高生产力等目标。过去,应用软件基本上是按照业务流程逐一对应开发的,每一个 应用自成体系、自立门户。事实上,任何应用都包含最基本的三个内 容:界面、业务逻辑和数据展现,应该可以重复利用。但就因为每个 应用自成体系,每开发一个新应用,就需要重开发一遍界面与数据展 现,重写一遍业务代码,浪费了大量的时间和人力。而SOA就是力求改变过去纵向开发应用的模式,将软件按照业务需求,定义成大小合适的“组件”,作为企业共享资源,随时调用。SOA的核心就是找到将软件组织在一起的方法。SOA带给用户的好处很明显,除了前面提到的可以降低开发成本, 提高系统
31、集成度和响应速度等,还能帮助解决因为系统升级带来的烦 恼。传统的软件升级对用户就意味着每三年来一次革命,不仅需耗费 大量金钱,还会闹得人仰马翻。现有的GRP等政务软件几乎都是铁板 一块,当某一点政策变化时,某一点功能需要调整时,必须全部升级, 这不但造成升级TCO成本太高,而且牵一发动全身,质量无法保证。 而未来SOA构架下的政务软件就像是一个不断进化的生态过程,某些 “服务(业务组件)”不断地局部升级,新的“服务”不断地加入, 只有这样的系统才能真正做到RTE实时政府,快速适应政务变化,避 免重复建设。1.1. 4. 1. 2 大数据并行计算框架技术基于ETL数据抽取融合技术和Quartz分
32、布式自动化任务调度框 架构建了融合计算平台,提出基于流程的可视化任务定制并行计算框 架技术,保证了时空大数据的自动、高效、可持续的汇聚。融合计算平台,根据不同的行业来源、不同的数据格式,按需定 义时空信息集成任务,通过搭载多个计算节点,实现多任务的自动化 并行计算,同时定制的任务可统一管理并设置执行周期,通过Quartz 框架的任务触发器实现周期性动态执行。融合计算平台,基于流程化的可视化任务定制要求,实现了数据 融合设计工具,按照功能划分成转换流程设计器、作业设计器。转换 流程设计器是以图形化的界面为介质,通过设计器提供的图形化设计 功能,完成对数据清洗转换策略及数据转换关系等处理过程进行定
33、制, 最终形成完整的转换流程模型;作业设计器同样提供了图形化流程定 制功能,通过作业设计器,规划作业步骤,定制步骤间的依赖关系, 使得整个作业定制过程更简洁、清晰。数据融合设计工具除了提供上述的界面交互功能外,还提供了包括数据源组件、作业组件及转换组件三个部分的扩展能力。在必要时, 可通过二次开发接口定制、注册自定义组件,从而扩展数据融合平台 的能力,满足具体的数据融合需求。同时,融合计算平台的任务调度系统建立在现有的网络结构之上,通过负载分担技术,将外部发送来的任务均匀分配到节点上执行,而 接收到请求的节点响应客户的请求。任务调度系统会把建立的任务存 放在任务队列中,节点按照节点组属性存放在
34、不同的节点组队列中。 负载均衡能够按照节点的配置信息将任务均匀分配给节点队列。通过计算中心的执行器启动执行任务的节点,每个节点对应着不 同的节点组(节点和节点组是多对一的关系)。建立节点时,会配置 节点的信息,以此判断节点的状态,根据心跳机制,按照一定的时间 间隔将符合要求的节点发送给任务调度系统;任务调度系统接收节点 时,如果节点队列中不包含此节点,就将节点放进队列中;反之,则 不放。通过模型及对应的参数信息建立的任务,按照定时调度quartz 框架,将任务发送到任务队列中。最终,启用线程,根据节点组关系, 将任务和节点匹配好从而执行任务。NodelNode2节点队列, 计算任务队列 S 任
35、务调度N o d e 21.1. 4. 1. 3 数据分析算法为了有效地对数据进行分析,需要辅助以各种分析算法。通过这 些分析算法,可发现数据变化规律和关联关系等,常用的分析算法有 分类(Classification)预测(Prediction)、相关性分组或关联规 贝lJ(Affinity grouping or association rules) 聚类(Clustering)、 复杂数据类型挖掘(Text, Web,图形图像,视频,音频等)等。(1)分类算法分类就是学习得到一个目标函数3把每个属性集x映射到一个 预先定义的类标号y。使用分类算法可以对商品或企业进行分类。(2)预测算法预测
36、就是基于历史已有数据的发展趋势,通过函数拟合计算出将 来时间段的数据值。预测算法可用于海关进出口宏观走势分析、商品 价格走向等。(3)关联规则关联规则算法就是发现一个事件和其他事件之间依赖或关联的 关系。对于本算法,可用于对商品进出口量、价格波动等分析等。(4)聚类聚类就是按照事物间的相似性进行区分和分类的过程,在这一过 程中没有教师指导,因此是一种无监督的分类。用聚类算法可对价格 进行聚类,以发现价格明显偏离的商品,也可对口岸商品进出口量进 行聚类,以发现突增或突减商品等等。(5)复杂数据类型挖掘复杂数据类型挖掘指对各种非结构化复杂数据概化后进行分析 挖掘。可用于对网页数据进行分析。本项目的数据清洗、大数据挖掘分析、智能分拨等环节均利用了 基于机器学习的人工智能技术,利用新兴的技术手段提升了数据治理 能力、实现了数据之间快速关联分析、提高了业务处置流程效率。1.1.4. 1.4 工作流引擎技术工作流引擎技术是当今世界上在IT应用领域属于基础性前沿技 术,以工作流引擎技术为核心的工作流管理系统在电子政务中的应用 正在成为发展的趋势。该系统以工作流管理系统为基础,以保证系统 不会因为流程的变化而瘫痪,将应用逻辑或流程逻辑相分离,使得流