《DB61∕T 1479-2021 交通运输数据符合性检测规范(陕西省).pdf》由会员分享,可在线阅读,更多相关《DB61∕T 1479-2021 交通运输数据符合性检测规范(陕西省).pdf(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、ICS 35.240.01CCS R 07DB61陕西省地方标准DB 61/T 14792021交通运输数据符合性检测规范Transportation data conformity test specification2021-08-12 发布2021-09-12 实施陕西省市场监督管理局发 布DB61/T 14792021I目次前言.II1范围.12规范性引用文件.13术语和定义.14一般规定.25检测对象与内容.26检测与判定.2附录 A(资料性)抽象数据元.7附录 B(规范性)数据项状态代码.10DB61/T 14792021II前言本文件按照GB/T 1.12020标准化工作导则第1
2、部分:标准化文件的结构和起草规则的规定起草。本文件由陕西省交通运输厅提出。本文件由陕西省交通运输标准化技术委员会(SX/TC 61063)归口。本文件起草单位:长安大学、陕西省交通运行监测中心。本文件主要起草人:张绍阳、王立平、王建辉、曹金山、赵晓宇、曲卫东、孙勇、张子卓、张杨、韩夏溪、叶润泽。本文件由长安大学负责解释。本文件首次发布。联系信息如下:单位:长安大学信息工程学院电话:029-62630027地址:西安市南二环中段邮编:710064DB61/T 147920211交通运输数据符合性检测规范1范围本文件规定了交通运输数据符合性检测的术语和定义、一般规定、检测对象和内容、检测与判定等。
3、本文件适用于交通运输行业信息系统设计、实施、验收等阶段的数据符合性检测。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。JT/T 697(所有部分)交通信息基础数据元JT/T 747.3交通运输信息资源目录体系 第3部分:核心元数据JT/T 1020-2016交通运输信息系统数据字典编制规范JT/T 1058-2016交通运输信息系统数据库字段命名及属性定义3术语和定义下列术语和定义适用于本文件。3.1数据标准data standard规定数据
4、项或数据集的定义、属性等的标准。包括数据元标准、元数据标准、接口内容定义标准、共享交换标准等。3.2数据项标准data item standard规定数据项的中文名称、英文名称、类型、格式、值域、单位等属性的标准。3.3数据集标准data set standard规定数据集的约束、出现次数及集合中数据项属性等的标准。3.4标准项standard data item数据标准中规定的数据项。3.5DB61/T 147920212数据符合性检测data conformity test检查测试信息系统数据项和数据集等与标准的符合程度。3.6抽象数据元abstract data element具有相同特
5、性词和表示词的数据元。3.7数据字典data dictionary在信息系统开发过程中存储数据的含义、来源、组织方式、用途、格式以及和其他数据的关系等信息的文档。通常包括数据项的说明、数据结构、数据流、数据存储、处理过程等内容。来源:JT/T 1020-2016,3.14一般规定4.1信息系统在设计、实施、验收阶段应进行数据符合性检测。4.2数据符合性检测依据包括但不限于:a)系统可行性研究报告、初步设计文件及招标文件中规定的数据类标准;b)相关领域的国家标准、行业标准和地方标准;c)抽象数据元(见附录 A)。4.3检测宜采用自动化工具辅助开展,工具的功能应满足本文件第 5 章和第 6 章的要
6、求,并具有报告生成、数据备份等功能。5检测对象与内容5.1检测对象在信息系统设计、实施和验收阶段应对以下对象进行检测:a)设计阶段:数据字典文档;b)实施阶段:数据字典文档、数据库表结构;c)验收阶段:数据字典文档、数据库表结构、运行数据。5.2检测内容各对象应检测内容如下:a)数据字典文档:数据字典文档符合性、数据项符合性和数据集符合性;b)数据库表结构:数据库与数据字典的一致性、数据表字段符合性;c)运行数据:值域符合性。6检测与判定6.1数据字典文档6.1.1文档内容完整性DB61/T 147920213数据字典文档至少应包括JT/T 1020-2016的表1、表2、表4和表5规定的内容
7、。6.1.2文档格式数据字典文档格式应满足以下要求:a)数据字典文档格式符合 JT/T1058-2016 附录 A 的要求。用户增加列时,在现有列后增加;b)每个数据库实例宜形成一个数据字典文档;c)数据字典文档电子版宜采用“.doc”、“.docx”、“.WPS”、“.xls”以及“.xlsx”等通用格式存储。6.1.3结果判定与处理6.1.3.1数据字典内容和格式符合 6.1.1 和 6.1.2 要求,则检测结论为通过,否则为不通过。6.1.3.2检测结论为不通过时,应进行整改,完成后再次检测。6.2数据项6.2.1数据项与标准的对应方法6.2.1.1数据项与标准对应宜采用标准项编号或中文
8、名称对应两种方式。6.2.1.2标准项编号对应使用该数据项指定的标准项编号直接在标准库中查找。6.2.1.3中文名称对应使用数据项中文名称和标准项中文名称进行智能对应或人工对应。数据项智能对应完成后,应采用人工方式进行核查。若对应不正确,按照以下顺序检查或指定:a)检查数据项中文名称命名是否规范、无二义性。若不规范应要求数据字典编制单位进行整改后重新采集;b)人工在智能对应结果备选集中选择更合适的标准项;c)如果备选集中没有符合的标准项,在标准库中进行人工指定;d)如果以上方式都未找到合适的标准项,可以使用抽象数据元进行检测;e)如果确认数据项名称没有合适的标准项与之对应,则可指定该项为“无标
9、准对应”。f)对应完成后,对数据项的状态进行标记,标记代码参见附录 B。6.2.2数据项检测6.2.2.1单个数据项检测基于 6.2.1 中成功对应的标准项开展。单个数据项的检测项目、检测方法、检测结果、检测结论及处理应符合表 1 规定。表 1单个数据项检测检测项目检测方法检测结果检测结论处理数据类型按照数据库管理系统支持的字段性质判断待检数据项的类型是否符合标准项的要求。是正确否错误按照 JT/T 1058-2016 表 3进行修改。数据格式将待检数据项的最小长度、最大长度以及精度等与标准项的要求进行比较。全部相等正确数据类型错误,或者精度小于标准,或者最小长度小于标准错误按照 JT/T 1
10、058-2016 表 3进行修改。其他弱正确数据单位判断待检数据项的单位与标准项计量单位的规定是否相同是正确否,但是同义词弱正确按照标准项的规定进行修改。否错误DB61/T 147920214表 1 单个数据项检测(续)检测项目检测方法检测结果检测结论处理数据值域数据字典文档:判断文档中的值域规定是否与标准一致。运行数据:判断待检数据是否在标准规定的代码集合中,或者是否符合编码的规定。是正确标准有规定但文档中值域为空弱正确按照标准项的值域规定进行修改。否错误注1:正确检测项目与标准规定完全一致;注2:弱正确与标准不完全一致,但是从数据理解和交换角度是可以接受的,或者是在当前阶段还无法判断正误;
11、注3:错误检测项目与标准规定含义不一致。6.2.2.2数据项每个检测项目的检测结果宜使用代码方式表示,应符合表 2 的规定。单个数据项检测结果宜使用 5 位的数字表示。第 1 位为数据项状态,2 位5 位分别为类型、格式、单位、值域的检测结果。例如“11100”表示该数据项状态为可检测,类型和格式正确,单位和值域未规定。表 2检测结果代码及含义代码含义0未规定1正确2弱正确3错误6.2.2.3信息系统数据项检测结果综合判定与处理a)信息系统数据项检测结果采用百分制计算,计算式为(1)。4111100%4njijirmn.(1)式中:r系统数据项检测结果正确(含弱正确)的比例;jim第j个数据项
12、的第i个检测项目得分,正确、弱正确为1,错误为0;n参与检测的数据项的总数量,即数据项状态代码为1、3、6的数量。b)检测结论为完全符合、基本符合和不符合三种。结论判别方法为:r 等于 100%,为完全符合;r 大于等于 90%小于 100%时,为基本符合;r 小于 90%时,为不符合。c)结果处理:对于不符合要求的数据项,应进行整改或逐项说明原因。6.3数据集6.3.1检测项目数据集的检测项目包括:a)约束检测。约束规定为必选项(M)、可选项(O)和条件可选(C)。DB61/T 147920215b)出现次数检测。出现次数仅出现一次用“1”表示,不限定可重复出现用“N”表示。不为 1 的固定
13、出现次数用相应的数字表示,如“2”、“3”、“4”等。c)数据项检测按 6.2.2 执行。6.3.2检测方法和流程数据集标准中第i个标准项记为Si,其出现次数记为ni,该标准项在待检数据集中的对应集合标记为Ai,集合中数据项的个数记为ci。检测流程如图1所示。图 1数据集检测方法和流程6.3.3结果判定与处理6.3.3.1检测过程未出现错误记录,则判定为符合该数据集标准。否则为不符合。如有多个数据集标准,应逐个进行判定。6.3.3.2对于不符合的数据集,应进行整改,并再次检测,直到全部通过。6.4数据库与数据字典的一致性检测DB61/T 1479202166.4.1检测内容:将数据库中的表与数
14、据字典文档一一对比。主要对比内容宜包括:a)数据库和数据字典中的表是否一一对应;b)数据库中表的名称、字段名称、字段的类型和格式是否与数据字典一致。类型和格式的对比方法按照 6.2.2 执行。6.4.2结果判定与处理6.4.2.1如果完全对应,则为通过,否则为不通过;6.4.2.2对不通过的部分,应对数据字典文档或者数据库设计进行修改。6.5运行数据6.5.1运行数据检测应采用随机抽样方法,抽样率不宜少于 1%且样本数量不少于 50 条,小于 50 条的数据表应全部检测。6.5.2有值域规定的字段,应将样本数据与值域规定的标准进行比对。6.5.3检测完成给出运行数据符合标准的比例和不符合标准的
15、样本。DB61/T 147920217AA附录A(资料性)抽象数据元A.1数据元三层结构模型A.1.1本文件采用三层模型来表示交通信息基础数据元的层次结构。如图A.1所示。图 A.1交通信息基础数据元层次结构模型A.1.2第一层为标准规定的数据类型层,如数值型、字符型、日期型、二进制型等基本类型。A.1.3第二层为抽象数据元层。抽象数据元不具有业务领域数据元的业务含义,仅表达业务领域数据元共同的表示特性。A.1.4第三层为基础数据元层。该层的数据元是交通信息基础数据元中规定的数据元。A.2交通信息抽象数据元表A.1是根据JT/T 697建立的交通信息抽象数据元及其部分属性。表 A.1交通信息抽
16、象数据元数据元编号中文名称同义词定义类型格式单位ab000000001姓名人;员;在户籍管理部门正式登记注册、人事档案中正式记载的姓氏名称字符型an.30ab000000002性别人员的男性、女性的类别属性字符型a.12ab000000003民族人员所属的、经国家认可在户籍管理部门登记注册的民族名称字符型an.10ab000000004籍贯出生地;出生时祖父的居住地;字符型an.50ab000000005身份证号身份证号码;18 位的公民身份证件号码字符型an.18ab000000006职称专业技术职务的等级称号字符型a.30ab000000007职务担任党派、行政和社会团体管理岗位的具体名称
17、字符型a.12ab000000008证书名称证书的完整名称字符型an.50DB61/T 147920218表 A.1交通信息抽象数据元(续)数据元编号中文名称同义词定义类型格式单位ab000000009照片人或物的电子影像二进制型JPEGab000000010健康状况健康情况的简要描述字符型a.20ab000000011工作简历工作过程的简要描述字符型.ulab000000012单位名称机构;厂名;公司名称;登记机关认定的单位全称字符型an.100ab000000013机构名称机构;机关;单位;登记机关认定的机构全称字符型an.100ab000000014机构代码国家质量技术监督部门编制的机构
18、唯一的法定标识。字符型an9ab000000015地址地点;住址;通讯地址或住址字符型an.100ab000000016邮政编码邮编所在地的邮政编码字符型n6ab000000017联系电话电话号码;手机;办公电话、手机等的号码字符型an.18ab000000018传真传真电话的号码字符型an.18ab000000019网址网站;网站的 URL 地址字符型an.50ab000000020电子邮箱Email;电子邮箱的名称字符型an.50ab000000021地名点名称;地名称;目的地;地方的正式名称字符型an.60ab000000022行政区划代码行政区划的数字代码字符型n6ab00000002
19、3路段名称路线名称;起点名称;终点名称;路段的正式称谓字符型an.60ab000000024船舶名称船名;船舶的中文名称字符型an.100ab000000025设备名称设备的规范名称字符型an.100ab000000026项目名称项目的规范名称字符型an.100ab000000027设备型号设备的出厂型号字符型an.100ab000000028桩号公路里程桩号数字型n.7,3kmab000000029经纬度Mid;经度;维度;地理坐标系中的经纬度坐标字符型n.12,8ab000000030坐标直角坐标系中的 X、Y 坐标数字型n.9,3mab000000031日期有效期起;有效期至;有效期止;
20、事件发生的日期日期型YYYYMMDDab000000032年度年份;事件发生的年度字符型n4ab000000033日期时间时间戳;时刻;时间;事件发生的时间日期时间型YYYYMMDDhhmmssab000000034月份事件发生的月份字符型n2ab000000035金额 1数额;资金;额度;额以亿元为单位的金额数字型n.10,2亿元ab000000036金额 2数额;资金;额度;额以万元为单位的金额数字型n.12,4万元ab000000037金额 3数额;资金;额度;额以元为单位的金额数字型n.10,2元ab000000038百分比比重;比率;所占比例数字型n.5,2%ab000000039人
21、数人多少的度量数字型n.10人ab000000040天数以天为计量单位的时间数字型n.10dDB61/T 147920219表 A.1交通信息抽象数据元(续)数据元编号中文名称同义词定义类型格式单位ab000000041是否Mid;状态;标志是或否的标识布尔型n1ab000000042备注意见;建议;结果;原因;理由;情况;说明;过程、原因等不确定长度内容的文字描述字符型.ulab000000043文件编号文件号;报告文号;文件文号;报告编号;文号;文件编号或序列号字符型an.100DB61/T 1479202110BB附录B(规范性)数据项状态代码B.1数据项状态代码及含义如表B.1 所示表 B.1数据项状态(s)代码及含义s含义1该数据项可检测2数据项无可采用标准(检测人员确认)3数据项无可采用标准(检测人员未确认)4数据项的数据库类型无法检测5数据项的数据类型无法检测6数据项缺少中文说明_