《5-2%20《信息技术%20%20藏文字符排序规范》编制说明doc.doc》由会员分享,可在线阅读,更多相关《5-2%20《信息技术%20%20藏文字符排序规范》编制说明doc.doc(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、国家标准信息技术 藏文字符排序规范(征求意见稿)编制说明一、工作简况1、任务来源信息技术 藏文字符排序规范是藏文信息处理领域急需制定的规范,此规范的立项申请经历了较长的时间:2012年7月,青海师范大学向青海省质量技术监督局提出制定藏文字符排序地方标准的建议书;2013年9月,青海师范大学向中国电子技术标准化研究院咨询信息技术 藏文字符排序规范标准建议书的技术问题;2014年4月,青海师范大学分别向全国信息技术标准化技术委员会藏文信息技术国家标准工作组全体大会提交了信息技术 藏文字符排序规范标准建议书。经过全国信息技术标准化技术委员会藏文信息技术国家标准工作组会议研讨,决定由青海师范大学牵头,
2、联合西藏自治区藏语文工作委员会办公室、中国藏学研究中心、青海民族大学、西藏大学、中国科学院软件研究所等高校和科研单位,吸收研究成果,制定统一的规范。2014年10月,全国信息技术标准化技术委员会向国家标准化管理委员会提出了标准立项申请。2015年7月国家标准化管理委员会在2015年第二批国家标准制修订计划中安排了本标准的制定工作,计划代号为20151552-T-469,标准名称为信息技术 藏文字符排序规范。信息技术 藏文字符排序规范由中国电子技术标准化研究院、青海师范大学、西藏自治区藏语文工作委员会办公室、中国藏学研究中心、青海民族大学、西藏大学、中国科学院软件研究所等单位负责起草。本标准主要
3、起草人有黄鹤鸣、熊涛、扎西次仁、安见才让、欧珠、吴健、多拉等。2、主要工作过程标准计划任务下达后,中国电子技术标准化研究院牵头成立了标准编制组,并制定了详细的标准研究实施方案。中国电子技术标准化研究院主要负责组织协调和标准文本修改,青海师范大学负责标准文本起草。为了保证藏文信息技术国家标准的研制质量,加快这些标准的研制进度。2015年11月19日至20日,全国信息技术标准化技术委员会在青海师范大学组织召开藏文信息技术国家标准启动会,会上讨论确定了5项藏文信息技术国家标准的标准责任人、标准研究实施进度,并签订了标准项目任务进度责任书。在此次会议上,青海师范大学的黄鹤鸣教授向与会专家详细介绍了信息
4、技术 藏文字符排序规范标准的起草情况,专家们对标准文本进行了认真审阅和热烈讨论,提出了很多修改意见和建议。专家们认为,信息技术 藏文字符排序规范标准草案的技术内容基本完备,但需要进一步修改完善,例如:需要对标准的文本内容及格式按照GB/T 1.1-2009给出的规则进行修改。2016年1月底,按照标准项目任务进度表的相关要求,青海师范大学于向全国信息技术标准化技术委员会藏文信息技术国家标准工作组秘书处提交了信息技术 藏文字符排序规范的正式文本草案,藏文标准工作组秘书处对该文本草案进行了认真修改。2016年3月底,藏文标准工作组秘书处将修改意见和建议反馈给青海师范大学,2016年4月初,青海师范
5、大学完成修改,并按照标准项目任务进度表的要求提交修改稿。2016年5月,中国电子技术标准化研究院组织专家对标准草案进行了标准内部审查,标准编制组根据标准内审专家意对标准草案再次修改,形成了标准征求意见稿,现发给各相关单位征求意见。3、标准编制的主要成员单位及其所做的工作本标准由中国电子技术标准化研究院、青海师范大学、西藏自治区藏语文工作委员会办公室、中国藏学研究中心、青海民族大学、西藏大学、中国科学院软件研究所等单位负责起草。其中,中国电子技术标准化研究院主要负责标准研究的组织协调和标准文本修改,青海师范大学负责标准文本起草,其他单位参与标准起草工作。二、标准编制原则和确定主要内容的论据及解决
6、的主要问题参照传统权威藏文字典排序规律的基础上,遵循字符编码国际标准ISO 10646、字符排序码国际标准ISO 14651以及Unicode的技术规范UCA(Unicode Collation Algorithm,Unicode排序算法),本规范从计算机处理的角度考虑藏文字符的排序原则,依据藏文音节和梵音藏文字符的结构特点,制定出适用于计算机信息处理的藏文字符计算机排序规范,制定出统一的藏文字符计算机排序规范,为藏文信息处理提供一套适应、实用、科学、系统的排序规则。 改变传统藏文字典对部分藏文字符的排序各自为政的被动局面,建立一个能够适合所有藏文字符的排序规则,制定出适合所有藏文字符的排序标
7、准,提高藏文信息的计算机检索水平,促进民族语言的信息化水平,提高政府部门对民族地区的信息化管理能力,保证藏文网络信息的安全。本标准编制过程中,主要遵从如下原则1、统一性原则本标准在藏文字符排序范围内对藏文音节的排序规则、采用的排序元素、藏文和梵音藏文字符混合排序时的规则进行统一约定。2、适用性原则本标准适用于藏文信息处理各领域,其他行业和有关学科可以参考使用。3、可行性原则本标准作为藏文字符排序方面的一项规范,确保本规范在藏文字符排序工程的研发过程中能够完整实现。4、有效性原则本标准作为藏文字符排序工程的一项规范,覆盖了藏文字符排序的基本面,在信息处理领域能够确保其有效性。5、协调性原则本标准
8、只是制订了一个藏文字符排序工程规范, 与藏文字符排序的进一步深入并不矛盾, 它不是藏文字符排序研究的终结, 藏文信息处理各相关单位可根据此规范进一步细化该规范。三、主要试验或验证情况分析为了实现藏文字符的动态组合,藏文字母被区分为占位形式和不占位形式。相应地,Unicode排序元素表(Default Unicode Collation Element Table,DUCET)为每个辅音字母的占位形式和不占位形式分别赋予了各自的排序元素,例如:字母占位形式的排序元素是.1C3E.0020.0002.0F51,而不占位形式(即)的排序元素是.1C3F.0020.0002.0FA1。表1 列出了更多
9、藏文字母的占位形式和不占位形式以及相应的排序元素。表1. 藏文字母的占位形式、不占位形式以及相应的排序元素举例辅音排序元素元音排序元素.2021.0020.0002.0F40.206E.0020.0002.0F72.2022.0020.0002.0F90.206F.0020.0002.0F73.2024.0020.0002.0F41.2025.0020.0002.0F91.207B.0020.0002.0F7D.0000.0127.0002.0F7F.2067.0020.0002.0F68.0000.0128.0002.0F7E.2068.0020.0002.0FB8对同一个辅音字母而言,占位
10、形式的排序元素小于不占位形式的排序元素。如果用“”表示两个字母间的先后关系,则所有辅音字母的占位和不占位形式间的先后关系为: 。通过选取有代表性的七类字符串来测试标准第4章所描述的算法的有效性。这七类字符串是:英文字母串“collation”; 藏文数字串“”; 一般藏文字母串“”;梵音藏文音节串“”和“”;本地藏文音节串“”、“”、“”和“”;符号串“”以及混合字符串“AB”。这七类字符串的排序结果见表2,可以看出它们间的排序结果符合要求。表2. 对七类藏文字符串的排序结果字符/音节音节序列分解后的字母序列ABAB collationcollationCollation 四、知识产权情况说明
11、本标准不涉及知识产权及专利内容。五、产业化情况、推广应用论证和预期达到的经济效果无六、采用国际标准和国外先进标准情况国际上未见有关藏文字符排序的同类标准。七、与现行相关法律、法规、规章及相关标准的协调性本标准中,藏文字符的编码方式采用GB 16959-1997信息技术 藏文编码字符集 基本集和GB 13000-2010信息技术 通用多八位编码字符集(UCS)中规定的方式,即采用动态组合方式。本标准中,梵音藏文字符指GB 16959-1997所收集的梵音藏文字母以及由这些梵音藏文字母的垂直组合形成的字符。本标准中,藏文字符的排序算法参考了ISO/IEC 14651:2011 Informatio
12、n technology - International string ordering and comparison - Method for comparing character strings and description of the common template tailorable ordering和 Unicode Technical Standard #10 Unicode Collation Algorithm。八、重大分歧意见的处理经过和依据无。九、标准性质的建议建议本标准作为推荐性标准发布实施。十、贯彻标准的要求和措施建议建议本标准发布后,实施过渡期半年。十一、替代或废止现行相关标准的建议无。十二、其它应予说明的事项无。信息技术 藏文字符排序规范国家标准编制工作组 2016-06-20- 7 -