《2022年自然语言处理_汉字编码字符集终版 .pdf》由会员分享,可在线阅读,更多相关《2022年自然语言处理_汉字编码字符集终版 .pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、汉字编码字符集数据摘要:为“减化”信息用“字” , (即“减少”信息处理中汉字“字符”的数量, “减小”信息处理中汉字字模库的容量, “转化”信息处理中汉字的“字符”的表达方式) ,特设计汉字“减化”表 。 希望能为汉字的“部件拆分”输入与“部件合成”输出显示提供基本 “参照” 。本方案的社会文化意义和商业用途,以后叙述。中文关键词:汉字编码 ,字符集 ,字模库 ,减化,信息处理 , 英文关键词:Chinese character encoding,Character Set,Font library,Simplify,Information Processing, 数据格式:TEXT 数据用
2、途:中文信息处理 ,汉字编码名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - 数据详细介绍:汉字编码字符集汉字“减化”表为倡议“减化”信息用“字”, (即“减少”信息处理中汉字“字符”的数量,“减小”信息处理中汉字字模库的容量,“转化”信息处理中汉字的“字符”的表达方式) ,特设计汉字“减化”表 。 希望能为汉字的“部件拆分”输入与“部件合成”输出显示提供基本“参照”。本方案的社会文化意义和商业用途,以后叙述。汉字编码字符集汉字“
3、减化”表(简称汉字“减化”表), 对各种“汉字编码字符集”中的“所有” 汉字“字符”进行“减化”表述,并将它们按一定的检索顺序排列。 汉字“减化”范围, 随字符集容量增加而扩大。汉字“减化”表,希望能为汉字的“部件拆分”输入和“部件合成”输出显示,提供一个基本“参照”。制作汉字“减化”表的依据是:1、现有的语言文字“基本”规范;2、传统的汉字经典文献。表中:汉字编码、 部首编码和“减化”表述编码, 采用汉语拼音拼写。 声调,“阴平、阳平、上声、去声”,用汉语拼音拼写,或缩写;或用数字“1234”对应表示;这里,按现有习惯,用“1234”表示汉语四声,轻声,用数字“5”表示。这些编码, 描述汉字
4、、 部首和“减化”组合的“一般读音”,即一般人群能够识读的读音。笔顺编码,采用笔画代码描述。“横竖撇点折”,用汉语拼音拼写,或缩写;或用数字代码表示;这里,按现有习惯,用数字“12345”对应表示。单字的笔顺编码,以现有汉字笔顺规范为准。汉字编码、 部首编码、“减化”表述编码和笔顺编码的“横向排列组合”,是汉字“语文基本属性”的一种代码描述样式。在基础教育中, 可将它们与汉字一起,作为“整体识认”的对象。数据预览:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 4 页 - - - - - - - - - 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 4 页 - - - - - - - - - 点此下载完整数据集名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 4 页 - - - - - - - - -