《文字输入技术.ppt》由会员分享,可在线阅读,更多相关《文字输入技术.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 文字输入技术 目 录第一节第一节 文字输入基础知识文字输入基础知识目 录下一页上一页 退 出第四节第四节 五笔字型输入法五笔字型输入法 本 章 要 点目 录下一页上一页 退 出 教学目标1.了解文字输入的基本方法2.训练计算机键盘的基本操作3.掌握全拼、智能ABC的基本输入方法4.掌握五笔字型的基本输入方法 本 章 要 点目 录下一页上一页 退 出 教学重点1.训练计算机键盘的基本操作2.掌握全拼、智能ABC的基本输入方法3.掌握五笔字型的基本输入方法 教学难点五笔字型的基本输入方法第一节第一节 文字输入基础知识文字输入基础知识目 录下一页上一页 退 出 教学目标1.了解汉字编码的基本
2、方法2.了解常用的非键盘输入方法3.新输入法的发展情况介绍 教学重点 教学难点1.了解汉字编码的基本方法2.了解常用的非键盘输入方法新输入法的发展情况介绍目 录下一页上一页 退 出一、一、键盘输入法键盘输入法1.标准小键盘 .流水码:.音码:.形码:.音形码:2.整字大键盘笔触式输入 第一节第一节 文字输入基础知识文字输入基础知识目 录下一页上一页 退 出二、非二、非键盘输入法键盘输入法 1.手写输入法:第一节第一节 文字输入基础知识文字输入基础知识 蒙恬手写板和汉王手写板 目 录下一页上一页 退 出2.语音输入法语音输入法 汉汉字字多多由由单单音音字字组组成成,便便于于语语音音识识别别。语语
3、音音输输入入法法是是利利用用联联机机的的话话筒筒作作为为输输入入设设备备,使使用用高高性性能能的的语语音音识识别别核核心心软软件件,对对语语音音进进行行识识别别并并转转换换为为文文本本文文字字,这这样样就就省省去去了了键键盘盘输输入入的的过过程程。但但这这种种输输入入方方法法的的缺缺点点是是:如如果果用用户户每每次次发发音音有有差差别别,会会影响了输入的识别率。影响了输入的识别率。第一节第一节 文字输入基础知识文字输入基础知识目 录下一页上一页3.光学字符识别(OCR)技术 光学字符识别技术是利用扫描仪作为光学字符识别技术是利用扫描仪作为输入设备,将文稿扫描成图像,然后再通输入设备,将文稿扫描
4、成图像,然后再通过专用的光学字符识别(过专用的光学字符识别(OCROptical Character Recognition)系统,将图像中系统,将图像中的文本进行识别,转换成文本文字。的文本进行识别,转换成文本文字。退 出第一节第一节 文字输入基础知识文字输入基础知识目 录下一页上一页 退 出第四节第四节 五笔字型输入法五笔字型输入法 教学目标1.五笔字型输入法的学习2.五笔字型输入法的文字录入训练3.使学生熟练掌握五笔字型输入法 教学重点1.五笔字型输入法汉字的拆分原则2.末笔字型识码的添加3.简码的使用4.词组的输入5.难检字的学习6.五笔字型输入法的文字录入训练目 录下一页上一页 退
5、出 教学难点1.汉字字型的区分2.末笔字型识码的添加第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页要快速地进行汉字的输入,输入方法必须是:要快速地进行汉字的输入,输入方法必须是:第一,每个汉字编码的重码要少;第二,尽量减少击键次数;第三,编码要有规律,易于掌握。五笔字型基本具备这些优点。无论多么复杂的汉字和多长的词组,最多只需击键四下,即可输入计算机;每个汉字平均击键2.6下;重码率低于万分之二,可以盲打。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页一、一、五笔字型中汉字结构分析五笔字型中汉字结构分析1.汉字的三个层次汉字的三个层次 一个完整的汉字,可以划分
6、为三个层次:笔笔画画、字根和单字。字根和单字。笔画:在书写汉字时,不间断地一次连续写成的一个线条。五笔字型中,将汉字的基本笔画分为五种:横、竖、撇、捺、折。字根:由若干笔画组成的、相对不变的结构,称为字根。绝大多数字根是常见的偏旁部首。五笔字型中最基本的字根有130个左右,它们是构成汉字的“基本”单位。因此,可以说基本笔画(5种)组成字根(130个),字根组成汉字(成千上万种)。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页2.汉字的五种笔画汉字的五种笔画 汉字的基本笔画有五种,横、竖、撇、捺、折,为了便于记忆和应用,对这五种笔画进行了编码,代码分别为1、2、3、4、5,如
7、下表所示。退 出第四节第四节 五笔字型输入法五笔字型输入法一,丶代号笔画名称 笔画走向 笔画及其变形 1横左右 一2竖上下 丨,亅 3撇右上左下 丿 4捺左下右上 丶 5折带拐弯 乙 目 录下一页上一页3.3.汉字的三种类型汉字的三种类型根据构成汉字的各字根间的位置关系,可以把汉字分成三种类型,如下表所示。退 出第四节第四节 五笔字型输入法五笔字型输入法字型字型代号字例左右型1种明汉湘上下型2字花型室杂合型3困凶乘本进司且目 录下一页上一页4.4.汉字的四种结构汉字的四种结构 基本字根可以拼合组成汉字。在组成汉字时,根据字根位置关系可以分为四种类型:单、散、连、交。“单”指字根本身是一个汉字(
8、成字字根),如:“王、目、雨、文、车”。“散”指构成汉字的基本字根之间的相互位置关系,分别属于左右、上下之一,即具有散结构。如:“汉、胡、湘、笔、型”。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页“连”有两种情况:指一个基本字根连一个单笔画。如:“自、尺、产、千、不、下”。带点结构,认为相连。如:“勺、术、太、主、义、斗”。“交”指几个基本字根交叉组成汉字。如:“农、里、必、申、果、电”。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页二、二、五笔字型中字根的键盘设计五笔字型中字根的键盘设计 在五笔字型方案中,把那些组字能力强,而且在日常汉字中出现次数多
9、(实用频度高)的字根,选作基本字根,共130个。这样就可以说,一切汉字都是由“基本字根”组成,其它非基本字根可以看成是由基本字根组合而成的。为了把130种字根分布到键盘中各字母键上去,首先把键盘字母键分成5个区,编码分别为15。每个区再分成5个位,位号分别为15。区号和位号组成了一个字母键的编码,用1155表示。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页 键盘分区及键名表 退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页2.2.基本字根的键盘分布基本字根的键盘分布 在五笔字型方案中,将25个字母键分为五个区,将130个基本字根按笔画分布在五个区中,在每
10、个键上都安排几个,并把字根表中每个键上的第一个字根称为键名。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页 退 出第四节第四节 五笔字型输入法五笔字型输入法五笔字型键盘字根总图 目 录下一页上一页五笔字型字根与键位的关系有如下三个特征:五笔字型字根与键位的关系有如下三个特征:与键名字根形态相似或相近。字根的首笔代码与其所在的“区号”保持一致,相当一部分字根的第二笔的代码与键位号一致(130个字根中位号与第二笔笔划相一致的达90种,约占字根总数的70%)。键位代码还表示了组成字根的单笔画的种类和数量。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页三、三、汉
11、字的拆分方法汉字的拆分方法1.1.五笔字型单字编码规则五笔字型单字编码规则 从形取,其顺序按书写规则,即从左到右、从上到下、从外到内;取码以130个基本字根为单位;对于字根数超过四个的汉字,按一二三未字根的顺序,最多只取四码;单体结构拆分取大优先;未笔与字型交叉识别。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页2.2.键面上有的字的输入方法键面上有的字的输入方法 键名的输入方法 键名汉字有25个,即:1区横起笔:王土大木工 2区竖起笔:目日口田山 3区撇起笔:禾白月人金 4区捺起笔:言立水火之 5区折起笔:已子女又纟 在输入键名汉字时,把其所在的键连敲四下即可。退 出第四
12、节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页 成字字根的输入方法每个键除了一个键名字根外,还有数量不等的其它几个字根,它们中间的一部分其本身也是一个汉字,称之为成字字根。成字字根的输入方法是:键名代码+首笔代码+次笔代码+末笔代码 退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页3.3.键面上无的字的输入方法键面上无的字的输入方法 四个或四个以上字根的字的输入方法四个或四个以上字根的字的输入方法这种较复杂的字的拆分方法为:第一字根第一字根+第二字根第二字根+第三字根第三字根+最末字根最末字根 不足四个字根的字的输入方法不足四个字根的字的输入方法 有些汉字,只有两个
13、或三个字根组成,这时可能会有许多汉字取码相同而出现重码。对于这些不足四个字根的字,就需要给它们加上一些信息,拆分方法为:第一字根第一字根+第二字根第二字根+第三字根第三字根+交叉识别码交叉识别码。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页 退 出第四节第四节 五笔字型输入法五笔字型输入法字型字型末笔末笔左右型左右型1 1上下型上下型2 2杂合型杂合型3横横11(G)12(F)13(D)竖竖21(H)22(J)23(L)撇撇31(T)32(R)33(E)捺捺41(Y)42(U)43(I)折折51(N)52(B)53(V)末笔字型交叉识别码 目 录下一页上一页注意:注意:在
14、取交叉识别码时,对末笔的取法有如下规定:在取交叉识别码时,对末笔的取法有如下规定:所有包围或半包围型汉字的末笔,取被包围部分的末笔。对于末字根为“力、刀、九、七”时,一律认为末笔为折。“我、成、找”等汉字的末笔取“丿”。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页另外,对于字型也有如下规定:另外,对于字型也有如下规定:凡单笔画与字根相连或带点结构都视为杂合型。久、义、太、勺等。字型区分时可用“能散不连”的原则,如:午、卡、严都视为上下型。内外型字属于杂合型。如:困、同、区等。含有“走之”的字为杂合型。如:“进、逞、远”等。以下各常用字为杂合型:可、床、厅、龙、尼、工、后、
15、反、处、办、皮、飞、死、疗、压。但相似的:左、右、看、者、布、色、友、冬、灰等视为上下型。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页4.4.五笔字型中汉字的拆字原则五笔字型中汉字的拆字原则 单字根汉字:单字根汉字:就是成字字根,这种汉字只有一个字根,不用再拆,编码方案有单独规定。散结构的汉字:散结构的汉字:由于组成这种汉字的字根之间没有什么关联,各部分相对独立,所以拆分时只需简单地将那些字根独立出来就行。连笔结构:连笔结构:拆分成单笔画与基本字根。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页 交叉结构或交连混合结构:交叉结构或交连混合结构:按书写顺
16、序拆分成几个已知的最大字根,所谓最大字根,是以增加一笔就不能构成已知字根这个原则来决定笔画的归属。拆分时要注意的几点,归结起来,可以说成:取取大大优优先先,兼兼顾直观,能连不交,能散不连。顾直观,能连不交,能散不连。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页四、四、简码简码 1.1.一级简码(即高频字)一级简码(即高频字)25个键每键安排一个常用的高频汉字。输入的方法是:击键一下击键一下+空格空格。2.2.二级简码二级简码 二级简码取单字全码的前两个字根代码,最多有2525=625个。输入方法是:第第一一字字根根+第二字根第二字根+空格键。空格键。3.3.三级简码三级简
17、码三级简码取单字全码的前三个字根代码,三级简码共有4400多个。输入方法是:第第一一字字根根+第二字根第二字根+第三字根第三字根+空格键。空格键。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页五、五、词组词组 五笔字型输入法中设计了词语的输入方法,并且把词组的输入与单字的输入相统一。不管多长的词语,一律取四码。具体输入方法为:1.二字词:分别取两个字的前两个字根。如:经济:纟又氵文(XCIY)操作:扌口亻(RKWT)2.三字词:前两个字各取第一字根,最后一字取其前两个字根。如:计算机:讠竹木几(YTSM)操作员:扌亻口贝(RWKM)退 出第四节第四节 五笔字型输入法五笔字型
18、输入法目 录下一页上一页3.多字词:取第一、第二、第三和最末一个汉字的第一个字根。如:科学技术:禾扌木(TIRS)汉字编码:氵宀纟石(IPXD)电子计算机:曰子讠木(JBYS)中华人民共和国:口亻人囗(KWWL)五笔字型计算机汉字输入技术:五宀木(GTGS)退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页六、六、重码和容错码的处理重码和容错码的处理 1.1.重码处理重码处理几个“五笔字型”编码完全相同的字,谓之“重码”。如:枯:木古一(SDG)柘:木石一(SDG)选择方法:当输入重码字的外码时,重码的字会同时出现在屏幕的“提示行”中,如所要的字在第个位置时,只管输入下文,该字
19、即可自动跳到光标所在的位置上;如果所要的字在第2个位置上,则可按数字键2,将所要的字挑选到屏幕上。“五笔字型”的重码本来就很少,加上重码在提示行中的位置是按其频度排列的,常用字总是在前边,所以实际需要挑选的机会极少,平均打万个字,才需要挑2次。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页2.2.容错码处理容错码处理 容错码有两个涵义:其一是您容易搞错的码,其二是容许您搞错的码。“容易”弄错的码,容许你按错的打,谓之“容错码”。“五笔字型”输入法中的“容错码”目前将近有1000个,使用者还可以自己再建立。“容错码”主要有以下两种类型:拆分容错:个别汉字的书写顺序因人而异,因而容易弄错者。字型容错:个别汉字的字型分类不易确定者。退 出第四节第四节 五笔字型输入法五笔字型输入法目 录下一页上一页3.3.难字编码难字编码 在进行汉字编码练习时,常常出现一些难拆的字,如:甲、田、由、申四个字,笔形几乎一样,但编码却不一样。对于这些难拆的字,用户只能通过反复的练习才能记住它,掌握它。因此书上给出部分难拆字编码表,供用户练习时参考。退 出第四节第四节 五笔字型输入法五笔字型输入法