《(2.1.13)--微课1-13汉字编码大学计算机基础.ppt》由会员分享,可在线阅读,更多相关《(2.1.13)--微课1-13汉字编码大学计算机基础.ppt(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 1.1313 汉字编码汉字编码 汉字编码u在计算机中汉字如何表示?u如何将汉字输入计算机?u如何将计算机内存储的汉字信息输出显示?汉字编码uu对汉字编码常用的字符集是GB2312-80,其全称为信息交换用汉字编码字符集基本集。uuGB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共7445个图形字符。其中包括6763个汉字,这些汉字按照使用频率高低分为两级:一级汉字3755个,按汉语拼音排列;二级汉字3008个,按偏旁部首排列。区位码uuGB2312将所有字符排放在一个94行、94列的二维表格中,并用01至94分别对行和列依
2、次进行编号,如第一行的行号为01,第94行的行号为94,第1列、第94列的列号为94等。其中的行号又称为区号,列号又称为位号,将区号和位号前后排在一块就构成了区位码。uu例如,“啊”字位于二维表格的第16行第01列,则区位码是1601。国标码uu区号和位号各加上32就构成了国标码,一个国标码占两个字节宽度,每个字节的最高位均为“0”。uu例如,“啊”字的区位码为1601,将区号16+32=48,位号01+32=33,所以“啊”字的国标码为4833.机内码uu将国标码每个字节的最高位由“0”变成“1”,就得到了汉字机内码。可见,一个机内码也占两个字节,但每个字节的最高位均为“1”,这主要是为了在计算机内部能够区分是汉字编码还是ASCII码。uu由于(10000000)B=128,将国标码两个字节的最高位设置为“1”相当于将国标码两个字节的数据分别加上128。uu例 如:“啊”字 的 国 标 码 为 4833,将 第 一 个 字 节 数 据48+128=176,33+128=161,将176和161转换为16进制数据,则求得“啊”字的机内码为(B0A1)H 汉字编码uu为了能直接从键盘上输入汉字,就需要为汉字进行相应的编码。目前常用的汉字输入编码方法可分为数字编码、拼音编码和字形编码。汉字编码uu汉字字形码通常有两种表示方式:点阵表示方式和矢量表示方式。小结小结小结小结 汉字编码方法