《2023年中文分词工具.docx》由会员分享,可在线阅读,更多相关《2023年中文分词工具.docx(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023年中文分词工具 第一篇:中文分词工具 当前几个主要的Lucene中文分词器的比较ZZ 1.基本介绍: paoding :Lucene中文分词“庖丁解牛 Paoding Analysis imdict :imdict智能词典所接受的智能中文分词程序 mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器 ik :接受了特有的“正向迭代最细粒度切分算法“,多子处理器分析模式 2.开发者及开发活跃度: paoding :qieqie.wang,google code 上最终一次代码提交:2023-06-12,svn 版本号 132 imdict :Xiao
2、PingGao,进入了 lucene contribute,lucene trunk 中 contrib/analyzers/smartcn/ 最终一次提交:2023-07-24,mmseg4j :chenlb2023,google code 中 2023-08-03昨天,版本号 57,log为:mmseg4j-1.7 创建分支 ik :linliangyi2023,google code 中 2023-07-31,版本号 41 3.用户自定义词库: paoding :支持不限制个数的用户自定义词库,纯文本格式,一行一词,运用后台线程检测词库的更新,自动编译更新过的词库到二进制版本,并加载 i
3、mdict :短暂不支持用户自定义词库。但 原版 ICTCLAS 支持。支持用户自定义 stop words mmseg4j :自带sogou词库,支持名为 wordsxxx.dic,utf8文本格式的用户自定义词库,一行一词。不支持自动检测。-Dmmseg.dic.path ik :支持api级的用户词库加载,和配置级的词库文件指定,无 BOM 的 UTF-8 编码,rn 分割。不支持自动检测。 4.速度基于官方介绍,非自己测试 paoding :在PIII 1G内存个人机器上,1秒 可精确分词 100万 汉字 imdict :483.64(字节/秒),259517(汉字/秒) mmseg4
4、j : complex 1200kb/s左右, simple 1900kb/s左右 ik :具有50万字/秒的高速处理实力 5.算法和代码困难度 paoding :svn src 书目一共1.3M,6个properties文件,48个java文件,6895 行。运用不用的 Knife 切不同类型的流,不算很困难。 imdict :词库 6.7M这个词库是必需的,src 书目 152k,20个java文件,2399行。运用 ICTCLAS HHMM隐马尔科夫模型,“利用大量语料库的训练来统计汉语词汇的词频和跳转概率,从而根据这些统计结果对整个汉语句子计算最似然(likelihood)的切分 mm
5、seg4j : svn src 书目一共 132k,23个java文件,2089行。MMSeg 算法,有点困难。ik : svn src 书目一共6.6M(词典文件也在里面),22个java文件,4217行。多子处理器分析,跟paoding类似,歧义分析算法还没有弄明白。 6.文档 paoding :几乎无。代码里有一些注释,但因为实现比较困难,读代码还是有一些难度的。imdict : 几乎无。ICTCLAS 也没有具体的文档,HHMM隐马尔科夫模型的数学性太强,不太好理解。 mmseg4j : MMSeg 算法 是英文的,但原理比较简洁。实现也比较清晰。 ik :有一个pdf运用手册,里面有
6、运用示例和配置说明。 7.其它 paoding :引入隐喻,设计比较合理。search 1.0 版本就用的这个。主要优势在于原生支持词库更新检测。主要劣势为作者已经不更新甚至不维护了。 imdict :进入了 lucene trunk,原版 ictclas 在各种评测中都有不错的表现,有坚实的理论基础,不是个人山寨。缺点为短暂不支持用户词库。 mmseg4j :在complex基础上实现了最多分词(max-word),但是还不成熟,还有很多需要改良的地方。 ik :针对Lucene全文检索优化的查询分析器IKQueryParser 8.结论 个人觉得,可以在 mmseg4j 和 paoding
7、 中选一个。关于这两个分词效果的对比,可以参考: 或者自己再包装一下,将 paoding 的词库更新检测做一个单独的模块实现,然后就可以在全部基于词库的分词算法之间无缝切换了。 ps,对不同的 field 运用不同的分词器是一个可以考虑的方法。比方 tag 字段,就应当运用一个最简洁的分词器,按空格分词就可以了。 =以上部分为网上转载= Paoding 的具体运用: 最新版本JAR包在Lucene3.0下会报错,干脆运用Lucene2.9.4即可。另外其论坛说也可以干脆运用源码编译。 字典的添加:添加新字典,需删除dic文件夹下 piled文件,重新编译。 其次篇:luceneIKAnalyz
8、er 中文分词及索引,简洁实例 :/posts/list/344.page import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.document.DateTools; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.Hits;
9、import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import org.mira.lucene.analysis.IK_CAnalyzer; import java.io.File; import java.io.FileNotFoundException; import java.io.IOExcept
10、ion; import java.io.FileReader; import java.util.Date; public class Searcher private static String INDEX_DIR = Searcher.class.getResource(“/).getPath()+“/data/index;/“c:luceneindex; private static String DOC_DIR =Searcher.class.getResource(“/).getPath();/“c:lucenedoc;public static void main(String a
11、rgs)throws Exception String queryString; queryString = “; File indexDir = new File(INDEX_DIR); File docDir = new File(DOC_DIR); Date start = new Date(); / try IndexWriter writer = new IndexWriter(INDEX_DIR, new IK_CAnalyzer(), true); System.out.println(“Indexing to directory + INDEX_DIR + “.); index
12、Docs(writer, docDir); System.out.println(“Optimizing.); writer.optimize(); writer.close(); Date end = new Date(); System.out.println(end.getTime()start)+ “milliseconds)that matched query + q + “:); for(int i = 0;i hits.length();i+) Document doc = hits.doc(i);/ System.out.println(“file: + doc.get(“pa
13、th); 第三篇:中文分词 - 同义词、近义词词库2 同义词库 天昏地暗=暗无天日 窃笑=暗笑 阴影=暗影 切口=暗语 黑暗=暗中 邋遢=肮脏 抬头=仰头 傲睨一世=仰头望天 昂扬=昂扬 凹地=凹地 凹凸=凹凸 熬煎=熬煎 熬炼=熬炼 翱翔=翱翔 傲岸=傲岸 高傲=傲慢 渺视=傲睨 傲世轻物=傲睨万物 傲睨万物=傲睨一世 傲睨万物=傲世轻物 睥睨=傲视 坚贞不屈=傲雪欺霜 骄兵必败=傲卒多败 骄兵必败=傲卒多降 隐私=奇异 隐私=奥密 玄妙=奥妙 后悔=懊悔 苦恼=懊恼 后悔=沮丧 四行孤军=八百壮士 才高八斗=八斗之才 八面受敌=八方受敌 八棍子撂不着=八竿子打不着 陈腔滥调=八股 稀惊奇异
14、=八怪七喇 八竿子打不着=八棍子撂不着 不前不后=八两半斤 五花八门=八门五花 八面玲珑=八面见光 八面见光=八面玲珑 八面受敌=八面受敌 气概汹汹=八面威武 发草帖=八字帖 逢迎=巴结 渴望=希望 翦绺=扒手 废除=拔除 起锚=拔锚 适得其反=拔苗助长 选取=拔取 扶植=拔擢 猖=跋扈 进退失据=跋前疐后 动辄得咎=跋前踬后 后记=跋文 促膝谈心=把臂而谈 痛处=把柄 操纵=把持 切脉=把脉 看管=把守 戏弄=把玩簸弄 留神=把稳 驾驭=把握 花招=把戏 歇工=罢工 而已=罢了 撤职=罢免 歇手=罢手 放手=罢休 蛮横=霸道 机谋=霸术 攻克=霸占 呆子=白痴 白费=白搭 鹤发=白发 皓首苍
15、颜=白发苍颜 庞眉皓发=白发银须 白搭=白费 枉费心机=枉费心机 口语=白话 光阴似箭=白驹过隙 石蜡=白腊 洋蜡=白蜡 白天=白日 白日升天=白日飞升 白日飞升=白日升天 空手=白手 自食其力=白手起家 老人=白叟 白昼=白天 白净=白皙 沧海桑田=白云苍狗 碧眼儿=白种人 白天=白昼 利剑=白 千般=百般 百发百中=百步穿杨 扶摇直上=百尺竿头 百辞莫辩=百辞莫辩 矢无虚发=百发百中 民生凋敝=百孔千疮 合家=百口 寥寥无几=百里挑一 千了百当=百了千当 鸭蛋虽密也有缝=百密一疏 大惑不解=百思不解 百无禁忌=百无禁忌 黎民=百姓 视为心腹=言听计从 摧枯拉朽=百战百胜 一往直前=百折不回
16、 百折不回=百折不挠 左右=摆布 动摇=摆荡 搭架子=摆架子 排列=摆列 部署=摆设 开脱=摆脱 腐败=败北 松弛=败坏 败尽家业=败尽家业 莠民=败类 败事=败露 败露=败事 没趣=败兴 劣行=败行 换帖兄弟=拜把兄弟 离别=告辞 造访=探望 求神拜鬼=拜鬼求神 访问=拜候 参见=拜见 贺年=拜年 托付=拜托 访候=拜望 拜望=拜谒 纠缠不清=扳缠不清 攀谈=扳话 连累=扳连 交谈=扳谈 布鼓雷门=班门弄斧 凯旅=班师 盘游=般游 颁发=公布 宣布=公布发表 发表=颁发 花白=花白 雀斑=斑点 美丽=斑斓 花纹=斑纹 搬家=搬场 挪动转移=搬动 搬迁=搬家 挑衅=搬弄 挑拨离间=搬弄是非 搬
17、家=搬迁 木屋=板屋 呆滞=板滞 邦畿=版图 措施=方法 孔方兄=阿堵物 福寿膏=阿芙蓉 那个=阿谁 姨妈=阿姨 谄谀=阿谀 攀龙趋凤=阿谀奉承 攀龙趋凤=阿谀奉迎 愁肠寸断=哀肠百转 哀伤=哀悼 请求=哀告 悲啼=哀号 灾民=哀鸿 百孔千疮=哀鸿遍野 悯恻=哀怜 请求=请求 哀伤=哀伤 哀思=哀思 哀痛=哀痛 依次=挨次 挨饿=挨饿 靠拢=挨近亲善可亲=蔼然可亲 求贤若渴=爱才如命 求贤若渴=爱才若命 一毛不拔=贪夫徇财 尊崇=爱崇 恋慕=爱戴 爱好=爱好 敬服=疼惜 珍惜=疼惜保重 恋慕=仰慕 宠姬=爱妾 恋爱=爱情 己饥己溺=爱人如己 敬服=疼惜 居安思危=安不忘危 闲逛=安步 缓步徐行
18、=安步当车 布置=安插 顺产=安产 稳固=安定 布置=支配 支配=安放 循分=安分 安守故常=安安分分 按部就班=安分守纪 抚慰=安抚 清静=安好 克绍箕裘=成家立业 安定=安靖清静=安静清静=安静冷静偏僻 安家立命=安家立业 愉逸=安乐 安定=静谧 安眠=安眠 安定=清静 摆设=支配 清静=平安平安=平稳平和=平稳清静安然无恙=平稳无事安然无恙=平稳无恙 坚如磐石=安如盘石 坚如磐石=安如泰山 万无一失=安若泰山 安置=安设 立足=安家 安家立业=安家立命 清静=安适 安安分分=安守故常 安乐=安泰 妥当=安妥 同甘共苦=安危与共 劝慰=劝慰 牢固=平稳 休息=安眠 安逸=安闲 清静=安详清
19、静=安祥 休息=安歇 放心=安心 悠然=安逸 扎营=安营 自暴自弃=安于现状 何在=安在 安葬=安葬 高枕无忧=安枕无忧 怎知=安知 布置=安置 安置=安装 按部就班=按部就班 依次=按次 按例=按例 推拿=按摩 抑制=按捺 定期=按期 定时=按时 缘木求鱼=按图索骥 顺次=按序 根据=依据 文案=案牍 档册=案卷 静静=暗暗 潜藏=暗藏 暗流=暗潮 昏暗=暗淡 惨淡=暗澹 冷战=暗斗 阴沟=暗沟 谋害=暗害 灯号=暗号 灯号=暗记 冷箭=暗箭 含沙射影=暗箭伤人 私下=暗里 暗潮=暗流 办妥=办好 管理=办理 服务=办事 办好=办妥 豆剖瓜分=半壁江山 旗鼓相当=半斤八两 片刻=半晌 对折=
20、半数 中途=半途 功亏一篑=半途而废 半吐半吞=半吐半吞 不即不离=半推半就 半信半疑=半信半疑 半夜=半夜 东床=半子 店员=伴计 挚友=伴侣 陪伴=伴随 伴同=伴同 扮演=扮演 扮装=扮装 拌杂=拌合 拌合=拌杂 国脉=邦本 版图=邦畿 国家荣誉=邦家之光 国交=邦交 光临=帮衬 关心=帮助 帮助=帮手 资助=关心 捆绑=绑缚 署书=榜书 模范=典范 当中=傍边 旁观=傍观 歪路=傍门 目中无人=傍若无人 薄暮=黄昏 篾片=傍友 包揽=包办 容隐=包庇 包藏祸心=包藏祸心 包围=包抄 保证=包管 包罗=包含 包涵=包涵 包罗=包括 包办=包揽 包括=包罗 无奇不有=一应俱全 包涵=包涵 困
21、绕=包围 包括=包孕 批驳=褒贬 珍宝=珍宝 宝贵=宝贵 大札=宝缄 浮图=宝塔 珍宝=珍宝 铜山=宝穴 坚苦卓绝=饱经风霜 餍饫=饱食 警卫=保镳 保藏=保藏 连结=保持 生存=保存 掩护=爱惜 举荐=保举 保存=保存 守旧=保守 保卫=保卫 调养=保养 包管=保证 营垒=堡垒 人为=酬劳 酬劳=报答 抨击=报复 陈诉=报告 汇报=报告请示 应命=报命 致歉=报歉 得病=抱病 行侠仗义=抱不平固步自封=固步自封 志向=理想 怀愁=抱恨 愧疚=抱愧 歉仄=愧疚 抱冤=抱屈 捧头=抱头 狼狈而逃=抱头鼠窜 抱屈=抱冤 诉苦=埋怨 遁世=豹隐 *=暴动 狂风=暴风 罪恶滔天=暴戾恣睢 袒露=暴露
22、原形毕露=暴露无遗 暴动=* 狠毒=暴虐 大发雷霆=暴跳如雷 歹徒=暴徒 急躁=急躁 虐政=暴政 发作=爆发 爆竹=爆仗 爆仗=爆竹 鄙俚=卑劣 卑躬屈膝=卑恭屈节 奴颜媚骨=卑躬屈膝 猥贱=卑贱 卑劣=卑劣 鬼蜮伎俩=卑劣手段 奴视=卑视 草木皆兵=杯弓蛇影 人浮于事=杯水车薪 哀思=哀痛 悲凉=凄惨 追悼=哀伤 灰心=悲观 离合悲欢=悲欢离合 凄惨=悲凉 楚切=悲凄 哀痛=悲戚 悲啼=悲泣 难受=哀痛 叹伤=悲叹 悲泣=悲啼 哀思=悲恸 哀痛=哀思 碑帖=碑本 碑本=碑帖 斗极=北斗 寒风=北风 勾栏=北里 存案=备案 破釜沉舟=背城借一 南辕北辙=南辕北辙 后手=背工 配景=背景 反面=
23、反面 叛逆=背叛 背约=背信 背信=背约 孤注一掷=背注一掷 受宠若惊=被宠若惊 受骗=被骗 当选=被选 奔忙=奔波 奔跑=奔驰 旷达=奔放 奔驰=奔跑 奔驰=奔腾 驱驰=奔跑 跋山涉水=奔跑风尘 当地=本地 土产=本地货 天职=本分 祖籍=本籍 同族=本家 正事主=本家儿 原来=原来 本事=本领 舍本逐末=舍本逐末 舍本逐末=本末颠倒 职能=本能机能 今年=本年 资本=本钱 即日=本日 实质=本色 自己=本身 本领=本事 正事主=本事儿 个人主义=本位主义 真相=本相 本旨=本心 天性=本性 特性难改=本性难移 本心=本意天良 来源根基=本原 本心=本旨 素养=本质 簿本=本子 笨蛋=笨伯
24、笨伯=笨蛋 傻里傻气=笨头笨脑 鸠拙=笨拙 瓦解=崩溃 倾圯=崩裂 迫近=靠近迫良为娼=逼良为娼 欺压=逼迫 铤而走险=逼上梁山 传神=逼真 始祖=鼻祖 触目皆是=比比皆是 比方=比方 等到=比及 比力=比较 最近=比来 比较=比力 同等看待=比量齐观 相比=比拟 连年=比年 比岁不登=比年不登 好比=比方 角逐=竞赛 指手画脚=指手画脚 比年不登=比岁不登 交锋=比武 夫唱妇随=比翼双飞 青天=彼苍 互相=彼此 挥洒自如=笔底生花 卖文为活=笔耕墨耘 字迹=笔迹 条记=笔记 凭单=笔据 翰墨=笔墨 笔挺=笔直 鸾翔凤翥=笔走龙蛇 管见=鄙见 卑劣=鄙俚 吝啬=鄙吝 猥琐=鄙陋 唾弃=鄙弃 在
25、下=鄙人 亵渎=鄙视 卑劣=鄙俗 俗不行耐=鄙俗不堪 粗言=鄙言 俗语=鄙谚 鄙视=鄙夷 愚见=鄙意 迫不得已=必不得已 确定=必定 恭敬重敬=必恭必敬 确定=必定 必需=必需 需要=必要 终究=终归 断命=毕命 一举而竟全功=毕其功于一役 终生一生没世=毕生 结业=毕业 缄口=闭口 缄口结舌=闭口无言 杜门不出=闭门不出 关门落锁=闭门塞窦 凭空捏造=闭门造车 解散=闭幕 花容月貌=闭月羞花 爱惜=庇护 荫庇=庇荫 寒家=敝宅 毛病=弊端 葱郁=碧绿 白种人=碧眼儿 避忌=避讳 逃难=避祸 避讳=避忌 制止=避开 遁迹=避难 躲债=躲债 边疆=边陲 相貌=边幅 界限=边界 疆域=边疆 边沿=
26、边缘 主笔=编缉 辑录=编录 纪年=编年 点窜=编削 体例=编制 编辑=编纂 入木三分=鞭辟入里 推动=鞭策 鞭笞=鞭挞 跌价=贬价 抑低=贬抑 便利=便当 燕服=便服 私函=便函 便利=便利 即是=便是 条子=便条 自制=廉价 酿成=变成 变更=变动 厘革=变革 变动=变更 变革=转变 转变无穷=转变多端 转变多端=转变无穷 幻化=改变 转变多端=改变莫测 变更=变换 背叛=变节 事故=变乱 失常=变态 各处=遍地 普遍=普及 体无完肤=体无完肤 剖白=辨白 鉴别=区分 辩解=辩白 反对=辩驳 谈锋=辩才 辩说=辩论 辩论=辩说 特出=彪炳 斥候=标兵 方向=标的目的 标记=标记 标记=标识
27、表记标帜 题目=标题问题 别开生面=独树一帜 口号=标语 标记=标记 秀丽=端庄 尺度=标准 说明=说明 内外=表里 暴露=表露 楷模=表率 外貌=外表 评释=说明 心情=表情 表现=表示 亮相=表态 表达=表现 演出=表演 表彰=表扬 表扬=表彰 别开生面=别出机杼 自出机杼=别出心裁 外传=别传 另外=别的 别名=别名 别开生面=独具匠心 别出心裁=别开生面 分别=别离 又名=别名 野史=别史 一无长物=别无长物 剖辨=别析 醉翁之意=别有用心 新颖=新颖 来宾=来宾 宾朋盈门=来宾盈门 三千珠履=来宾盈庭 宾朋盈门=宾朋迎门 宾朋迎门=宾朋盈门 摈弃=摈斥 驱除=摈除 屏弃=摈弃 光风霁
28、月=冰壶秋月 酷寒=冰冷 冷面=冰脸 冰冷=冰凉 龙脑=冰片 不染纤尘=冰清玉洁 水火不容=冰炭不洽 雪窖冰天=冰天雪地 叛乱=兵变 师出无名=兵出无名 军多将广=兵多将广 兵书=兵法 打仗=兵戈 艨艟=兵舰 军力=兵力 戎马=兵马 武器=兵器 战士=兵士 兵法=兵书 佳兵不祥=兵凶战危 虎帐=兵营 军种=兵种 承袭=秉承 而且=并且 草衣木食=并日而食 独一无二=并世无双 霸占=并吞 垂死=病笃 祸国殃民=病国殃民 全愈=病愈 医院=病院 货郎鼓=拨浪鼓 盘弄=拨弄 颠簸=波动 波涛=波澜 汹涌澎湃=汹涌澎湃 海浪=波浪 妨害=曲折 褫夺=剥夺 否极必泰=剥极必复 聚敛=剥削 吸血虫=剥削者
29、 昆季=伯仲 驳倒=驳斥 驳斥=驳倒 非难=驳诘 靠岸=泊岸 停车=泊车 怫然作色=勃然大怒 来路货=舶来品 泛爱=博爱 赢得=博得 博学多闻=博古通今 展览会=博览会 广博=博识 宏儒硕学=博学多才 博古通今=博学多闻 屠杀=搏斗 拚命=搏命 薄命=薄命 黄昏=薄暮 单薄=薄弱 软弱=薄弱虚弱 菲酌=薄酌 赔偿=补偿 增补=补充 调停=补救 修缮=补葺 补贴=补助 修理=补缀 哺养=培育 疑神疑鬼=捕风捉影 捕获=捕获 探员=捕快 网鱼=捕鱼 捕获=捕获 担忧分=担忧本分 担忧本分=担忧分 不守妇道=担忧于室 不守妇道=担忧于位 未便=不便 稳定=不变 鄙人=不才 不理=不睬 意外=不测 不
30、成才=不进步 不行=不成 不进步=不成才 不进步=不进步 有失体统=不成体统 不食人间烟火=不吃烟火食 冷静自若=不迟不疾 不辞劳怨=不辞劳苦 不辞劳苦=不辞劳怨 不搭嘴=不搭腔 不搭腔=不搭嘴 不合时宜=不达时宜 不搭腔=不答腔 不打不相识=不打不成相识 不打不相识=不打不成相与 不打不成相与=不打不相识 不但=不单 不光=不但 不妥=不当 不作数=不当准 天诛地灭=不得善终 茫无头绪=不得要领 不停=不断 精益求精=不断改良 不合错误=不对 未几=不多 不违农时=不夺农时 不贰=不二 铁价=不二价 不二=不贰 数不胜数=不乏其人 非法=不法 非凡=非凡 没关系=不妨 没关系=不妨事 轻视=
31、不放在眼里 难分轩轾=不分高低 不顾曲直=不分皁白 不够=不敷 不顺手=不伏手 不服水土=不伏水土 不平=不服 水土不服=不服水土 不应=不该 吞声忍气=不敢则声 誓不两立=势不两立 装腔作势=一本正经 不敷=不够 未入流=不够格 掉臂=不顾 不分皁白=不顾曲直 不拘小节=不顾外表 悍然不顾=不顾一切 不但=不光 不外=不过 留神翼翼=毛骨悚然 欠好=不好 分歧=不合 不对=不合错误 不达时宜=不合时宜 反面=不和 半推半就=不即不离 不行胜数=不计其数 欠安=不佳 不露锋芒=不见圭角 不断=不竭 不但=不仅 风行一时=不胫而走 未几=不久不多 不顾外表=不拘小节 未定=不决 不停=不绝 不易
32、之论=不刊之论 不胜=不堪 不行=不行 多如牛毛=不行偻指算 不计其数=不行胜数 不行思议=不行思议 盛气凌人=目空一切 不能=不克不及 不愿=不愿 烦懑=不快 不稂不莠=不郎不秀 不郎不秀=不稂不莠 坐享其成=坐享其成 不睬=不理 倒霉=不利 不意=不料 不惜=不吝 不吝指教=不吝金玉 不吝珠玉=不吝指教 不吝指教=不吝珠玉 不留神=不留神 不留神=不留神 杀鸡取卵=不留余地 不见圭角=不露锋芒 不露锋芒=不露圭角 不露声色=不露神色 不露神色=不露声色 稳定=不乱 不正经=非驴非马 岂论=不管 不落俗套=不落窠臼 不落窠臼=不落俗套 难免=不免 未免=不免难免 不约而合=不约而同 不克不及
33、=不能 不能胜数=不能尽数 不能尽数=不能胜数 欲罢不能=不能自休 不能自制=不能自已 不能自已=不能自制 不宁奈=不宁不奈 不宁耐=不宁不耐 不宁不奈=不宁奈 不宁不耐=不宁耐 数奇=不偶 中庸之道=不偏不倚 不屈=不平萍水相逢=不期而遇 生吞活剥=不求甚解 不平=不屈 奋不顾身=不屈不挠 否则=不然 冰清玉洁=不染纤尘 克日=不日 幸不辱命=不辱使命 不中听=不中听 非驴非马=不三不四 惠而不费=不伤脾胃 境况尴尬=不上不下 失慎=不慎 不堪=不胜 不乏其人=数不胜数 昏迷不醒=不省人事 时时=时常 不识时务=不识时变 不识时变=不识时务 不识之无=不识一丁 不识一丁=不识之无 不吃烟火食
34、=不食人间烟火 担忧于室=不守妇道 不伏手=不顺手 非死即伤=不死即伤 不绝=不停 欠亨=不通 差异=不同 别出心裁=不同凡响 不当=不妥 不过=不外 有良心=不忘本 不夺农时=不违农时 不惟=不唯 不唯=不惟 不言而喻=不问可知 吊儿郎当=不务正业 不断=不息 不吝=不惜平分秋色=不前不后 断绝往来=不相闻问 不用=不消 不行=不行 不断=不休 囚首垢面=不修边幅 生而知之=不学而能 观=不雅 不雅=不雅观 不问可知=不言而喻 不厌求详=不厌其详 不厌其详=不厌求详 没关系=没关系 纷歧=不一 所在多有=不一而足 天经地义=不移至理 不遗余力=不遗余力 第四篇:7 分词 分词 分词是英语中特
35、殊重要的连词成句的手段。本章将从分词的意义及其在句中的作用来探讨分词的造句规则。 一、分词的意义 1分词的意义 从分词本身所表达的意义来看,分词分为如今分词和过去分词,两者具体区分如下: 1从语态角度来看,如今分词表示主动意义,它与所修饰的名词构成主谓关系,如:The man standing at the gate is my English teacher.换句话说:The man who is standing at the gate is my English teacher.过去分词通常表示被动意义(不及物动词的过去分词除外),与它所修饰的名词构成动宾关系,如:the broken
36、cup意思是:Someone broke the cup.或The cup was broken.2.从时态角度来看,如今分词一般表示进行动作,过去分词则表示完成的动作。a.fallen leaves b.falling leaves 这里a相当于leaves that have fallen,即表示完成的动作;而b相当于leaves that are falling,即表示进行的动作。 a.地上的落叶 b.正在飘落的叶子 a.sunken ships b.sinking ships 这里a相当于_ships that have sunken,即表示完成的动作;而b相当于ships that
37、are sinking,即表示进行的动作。 a.漂浮了的船只 b.正在下沉的船只 二、分词的作用 分词的作用相当于形容词和副词,因此在句中主要是充当定语和状语,相当于一个定语从句或状语从句。考生应重点驾驭分词的以下用法特点: 1分词短语作定语要后置,相当于一个定语从句。 2分词短语作状语有两种结构:分词规律主语和句子主语一样;独立分词结构。分词短语作状语,相当于一个状语从句。 分词作定语 分词作定语其位置关系有两种。单个分词作定语,一般置于被修饰名词的前面;分词短语作定语,只能置于被修饰名词的后面。如今分词作定语,表示与所修饰的名词有主谓关系或主动关系,过去分词作定语,表示与所修饰的名词有动宾
38、关系或被动关系。 (1)Additional social stresses may also occur because of the population explosion or problems means of transport.2000英译汉 这里如今分词arising修饰problems,作后置定语,与problems构成主动关系。problems arising from mass migration movements表示“大量人口流淌造成的问题。过去分词made修饰themselves,作后置定语,themselves构成被动关系,这里themselves指代mass m
39、igration movements 由于人口的猛增或大量人口流淌(现代交通工具使这种流淌相对简洁)造成的种种问题也会给社会造成新的压力。 (2)After all, what is the one modern form of expression almost completely to depicting happiness?(2023年阅读第四篇) 过去分词dedicated作定语,修饰名词expression,构成被动关系。 几乎完全致力于描述快乐的当代表现形式原委是什么? (3)To determine the consequences of sleep deficit, rese
40、archers have put subjects through a set of psychological and performance tests them, for instance, to add columns of numbers or recall a passage to them only minutes earlier.“Weve found that if youre in sleep deficit,performance suffers, says Dr.David.“Short-term memory is weakened, as are abilities
41、 to make decision and to concentrate. 如今分词requiring修饰tests,作后置定语,与tests构成主动关系,tests requiring them to add是说明这个刚试要求他们做什么。过去分词read后置修饰passage,与passage构成被动关系。 为了测定睡眠缺乏带来的后果,探讨人员让受试者接受一系列心理测试以及实力测试,包括做数字加法或回忆刚刚听过的文章。“我们觉察假如睡眠缺乏,那么实力测试就会受到影响,大卫医生说,“短期记忆实力会下降,决策力和集中力同样也会减弱。 (4)The emphasis on data first-h
42、and, with a cross-cultural perspective to the analysis of cultures past and present, makes this study a unique and distinctly important social science.本句有三个过去分词:gathered, combined, brought,它们的修饰关系是: 首先,gathered修饰data,作定语,译成“收集第一手资料。 其次,combined with是将emphasis和perspective两个关键词联系起来,构成一个并列关系,相当于说:“A, c
43、ombined with B,其他类似结构还有“A, together with B“,或“A, coupled with B,意思是将A与B结合起来,即“强调第一手资料,然后加上跨文化视角。很多考生对这里combined with起着连接两个并列成分的作用看不出来,造成句子误译。这里三个过去分词gathered, combined和brought并非并列关系。 再次,brought是修饰perspective,作定语,相当于主动语态:bring a cross-cultural perspective to the analysis of cultures past and present,
44、这里past and present是作后置定语修饰。The emphasis, combined with a perspective, makes this study a social science.强调收集第一手资料,加上在分析过去和如今文化形态时接受跨文化视角,使得这一探讨成为一门独特并且特殊重要的社会科学。 (5)Its easy to blame the decline of conversation on the pace of modern life and on the vague changes _ place in our ever-changing world.A.
45、takingB.to takeC.takeD.taken 此题考查分词作定语的用法。这里分词要修饰名词changes,而changes与动词短语 take place构成主动关系,所以用如今分词taking,故A正确。 我们很简洁把人们之间沟通削减归咎于快节奏的现代生活和快速转变的外部世界。 (6)The examples of Virtual Vineyards, Amazon, com, and other pioneers show that a Web will attract online customers.(1999-2-4) 网络葡萄园、亚马逊和其他一些开拓者的事例显示: 出售
46、合适商品并辅之以适当沟通互动、热忱周到和平安牢靠服务的网站将会吸引网上顾客。than an intuitive one.(2023-1-4) 这次试验的胜利,以及后来证明记忆本身不是遗传确定的探讨,使 Ericsson 得出结论:记忆行为更多地属于认知练习而不是直觉活动。whose clear advantage was its mastery of the electronic world.(2023-1-2) 以确定优势领先的是弗吉尼亚的一个名为 “公开来源情报公司的小公司,它的明显优势是对电子世界的把握。 (9)The trend was naturally most obvious in those areas of in the United Kingdom.(2023-1-2) 在特别以数学和试验室训练为基础的科学领域,这种倾向自然特殊明显,并且可以就英国的地质学进展得到证明。 (10)Then it sponsors lots of symposiums and a credibility project wondering why customers are annoyed and fleeing in large numbers.(2023-3-7)