《一个面向Internet的个性化信息检索系统模型.pdf》由会员分享,可在线阅读,更多相关《一个面向Internet的个性化信息检索系统模型.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一个面向!#$%$#的个性化信息检索系统模型韩立新,陈贵海,谢立(南京大学计算机软件新技术国家重点实验室,&()*江苏南京)摘要:随着!#$%$#上的信息量急剧增加,如何使用户获得有用的信息已成为信息检索系统急需解决的问题+文中提出了一个个性化信息检索系统模型(,-%./)+该模型结合用户访问模式和类层次结构来检索用户需要的信息+文中还提出了多个算法,这些算法综合运用数据挖掘、情报检索和机器学习等技术,较好地解决了在生成用户访问模式时人工干预较多、自适应性较差、准确性较差以及在构造类层次结构时出现计算量较大所造成聚集速度较慢的问题+关键词:个性化信息检索;用户访问模式;类层次结构;数据挖掘;0
2、1$#中图分类号:2,*);2,*)*文献标识码:0文章编号:(*3&4&(&(&)(&4(&5(4(6!#$%(%)*#+,&-.%$/+#)0,1-#+2%1)-%3,&45*1%0*#)/+1%)+%1!66&-7,1-#+*708 9:4;:,?:4/-:,!=9:(!#$%$()*#)*&)+,)-$.!)+/#*$0$123).)4&,,#35634 736-$*86&,,#35634,96#348:&()*,;263#)!8*1),71:8AB-C-DE#/$-FA?#AG:GA%F-#:A A#/$!#$%$#:E:.%$-E:1 C%-F-#:.-HHD+2/$-I:
3、H:#D AG G-.:H:#-#:1?E$%E#A-./:$J$?E$G?H:GA%F-#:A:E FA%$-C FA%$:FKA%#-#GA%:GA%F-#:A%$#%:$J-H EDE#$FE+,-%./,-FAC$H GA%K$%EA-H:L$C!#$%$#:GA%4F-#:A%$#%:$J-H EDE#$FE:E K%AKAE$C+2/:E FAC$H.-/$HK?E$%E#A%$#%:$J$B/-#/$D$C ID.AFI:1.H-EE/:$%-%./D B:#/?E$%K%A4G:H$+M$J$%-H-H1A%:#/FE#/-#?E$N$D#$./AHA1:$E-%$K%AKAE
4、$C,E?./-E C-#-F:1,:GA%F-#:A%$#%:$J-H-C F-./:$H$-%:1+2/$E$-H1A%:#/FE.-F-N$-?E$%K%AG:H$H$EE F-?-HHD:#$%G$%$C,FA%$E$HG4-C-K#:J$-C FA%$-.?%-#$,-C F$-B/:H$-./:$J$-G-E#$%.A41%$1-#:1 EK$C:I?:HC:1#/$.H-EE/:$%-%./D ID%$C?.:1#/$.AFK?#:1 BA%NHA-C+9%5:#)$*:K$%EA-H:L$C:GA%F-#:A%$#%:$J-H;?E$%K%AG:H$;.H-EE/:$%-%./
5、D;C-#-F:1;01$#!引言随着!#$%$#应用的日益普及,如何从如此众多的信息中发现有用的信息已经成为困扰网络用户的一大难题,而建立个性化的信息检索系统正是解决这种问题的一个重要途径+M#-GA%C大学的 MF-%#,O-E-E 大学的 PI:B-&提出将用户访问模式(?E$%K%AG:H$)构造成层次结构,但是它们对用户可能有多方面的兴趣考虑不太多+M#-GA%C 大学的 M!Q2*是新闻过滤系统,它需要用户通过提交反馈信息进行训练,因此自动化程度不太高+RS!5和,$%EA-H R$IR-#./$%6都是根据浏览行为进行数据获取,但是对 R$I 页面上的内容考虑不太多+2T=U!V
6、和 MDEN:HHWR$I$%#3都是提供个性化推荐服务,然而服务质量不是很高+上述系统主要存在以下不足:()综合考虑个性化检索和浏览式检索各自的优点不够;(&)自动化程度不太高,它们主要采用的是要求用户输入自己的信息需求或使用机器学习技术要求用户提供大量的反馈信息来进行训练的方法;(*)不能准确把握用户的信息需求并且不能很好适应用户需求的变化+为解决上述问题,本文提出一个,-%./系统模型+该模型是一个主要面向!#$%$#的个性化的中英文信息检索系统,它尤为适用于对英文信息进行检索+,-%./系统模型的主要特点如下:()为了更好地满足用户的复杂需求,本文利用用户访问模式,类层次结构和关键词等
7、多种方式来构造个性化信息检索系统+对于用户经常感兴趣的内容,使用用户访问模式,利用 K?E/技术主动向用户发送感兴趣的信息,而对于用户的随机查询,用户通过类层次结构和关键词相结合的方式获得需要的结果+(&)在生成用户访问模式方面,它把关联规则挖掘法、情报检索技术、机器学习技术,以及对页面上的信息进行语法分析等方法结合起来+这些技术不是简单地堆积在一起,而是有机地结合在一起,这样做可避免单纯使用某一技术造成的缺陷+它具有不需人工干预、准确率较高、自适应性较强的特点+(*)在生成类层次结构方面,本文将多个具有相似特征的文档聚集成类,同时利用分收稿日期:&(4(4V;修回日期:&(4(V4(V基金项
8、目:国家自然科学基金(8AXV(3*(&));国家 YV*计划项目(8AXYV*4*(V4Z2(&4(*()第&期&(&年&月电子学报020=9=2TP8!0 M!8!0UAH+*(8A+&Q$I+&(&层聚类方法按照类的相似程度形成类层次结构!()我们对多#$%&系统的管理采用的是完全分布式的管理模式!每台加入到该多#$%&系统中的机器上都有一个管理程序,该程序负责#$%&的加入、退出、信息注册等!每当某个#$%&加入或退出时,都向本机的管理程序发出消息,而管理程序在更改本地信息的同时将该#$%&的动作通知给其它管理器!#$%&系统模型!(#$%&系统的体系结构()*+,系统是一个多#$%&
9、系统,整个系统有较明显的层次关系,自顶向下依次分为二层:人机交互层、信息处理层!对()*+,系统模型中的二个层次进行进一步细化就得到如图-所示的系统体系结构!图-()*+,系统的体系结构!#$%&系统的系统功能!(人机交互层(-)用户接口#$%&:它向系统发出请求和接受系统的服务!它主要是给用户提供一个友好的交互界面,该#$%&按照用户的习惯以问题的方式提出查询请求,从而用户不需对复杂的搜索引擎的语法进行研究!这样做避免了常用的搜索引擎所提供的关键字查询时所产生的用户对搜索引擎的查询语法并不熟悉,易导致用户无法对所要查询的问题抽取关键词或用户错误地表达自己的查询意图的缺陷!返回查询结果主要采用
10、二种方式!方式-:对于用户以问题的方式提出的随机查询,系统将查询结果以可扩展的类层次结构的形式返回给用户,以供用户进行浏览!由于类层次结构具有一定的可扩展性,因此查询的结果较为直观!方式.:接受用户访问模式#$%&主动发送回来的用户经常感兴趣的内容!(.)问题处理#$%&:由于此时的用户请求是以问题的形式提出,因此必须从用户提出问题的描述中抽取出关键词,按照这些关键词在问题中出现的次数赋于不同的权值,并从较为广泛使用的/0*12%3系统中找出与这些关键词相对应的同义词,并使用关联规则挖掘算法来获得这些关键词相关联的词,从而使检索的精度更高并使搜索信息的覆盖面更广!最后使用 0*逻辑连接符将这些
11、关键词和相应的同义词连接起来,使用)&1 逻辑连接符将这些关键词和相关联的词连接起来,以便产生系统的查询请求!限于篇幅,具体内容将在另一篇文章中作详细介绍!信息处理层信息处理层的各个#$%&的具体功能如下:(-)类选择#$%&:该#$%&从问题处理#$%&处接收查询请求,取出查询请求中的关键词,求出这些关键词和分类数据库中的每个类之间的相似度,找出相似度大于某一指定的阈值的一些类,使用类层次结构生成算法 45671+7)88696+)60&将这些类构造成类层次结构,返回给用户接口#$%&!(.)任务包装#$%&:如果没有从类选择#$%&中找出相对应的类,任务包装#$%&就从问题处理#$%&处接
12、收已处理过的查询请求,由于此时的用户请求是系统内部格式,而各个搜索引擎的语法都不尽相同,因此任务包装#$%&将其转换成符合各个搜索引擎语法要求的查询请求,并将包装好的查询请求转给收集#$%&去进行具体的查询工作!正是任务包装#:$%&使得用户不需要去了解各个具体的搜索引擎的语法就可以对多个搜索引擎进行查询!(;)收集#$%&:对于从任务包装#$%&获得的查询请求,系统采用元搜索引擎技术向多个搜索工具如#7)等提出查询请求,并将得到的?A 列表进行合并,除去重复的内容,然后从各个不同的/服务器上获取页面内容,并将这些信息返回给文档抽取#$%&!()文档抽取#$%&:对收集#$%&返回的每个检索文
13、档,利用单个文档中关键词的抽取算法 B6&$7%8)CD7%获得一组关键词,将这些关键词构成关键词集!将所有检索文档和它们的关键词集一起返回给文档分类#$%&!(E)文档分类#$%&:使用文档归类算法 FGFH,将文档抽取#$%&返回的检索文档归入一些类中,并将这些类归入包含所有类的分类数据库中,同时使用类层次结构生成算法 45671:+7)88696+)60&将这些类生成类层次结构,将类层次结构返回给用户接口#$%&!(I)用户访问模式#$%&:该#$%&具有一定的学习性和反应性,它采用数据挖掘和机器学习等技术对日志文件、JK=参数中的信息以及用户发出的查询请求和已浏览过的查询结果进行不断的
14、分析和训练,使用构造用户访问模式的算法 J*%:)%D*0967%归纳出用户的兴趣模型,使用户访问模式更好地适应用户的动态需求变化!当分类数据库中收集到尚未发送给用户的信息时,用户访问模式#$%&采用 D58,技术主动将这些用户感兴趣的信息通过用户接口#$%&发送给用户,从而更好地满足特定用户的要求!)#$%&系统中关键技术的实现本节将介绍该系统中一系列关键技术的实现算法,并与相关算法进行相应的比较!)(构造类层次结构)(类层次结构生成算法*+,-.%-#/,0,%#1,2345671+7)88696+)60&算法能根据各个类之间的相似程度形成类层次结构,从而能有效反映类之间的相似性!因为考虑
15、到在类层次结构中的类不是非常多,所以 45671+7)88696+)60&算法采用自底向上的分层聚类方法!45671+7)88696+)60&算法避免了一些系统必须按某种拓扑结构进行分层聚类的方法!此外当相似度小于某一指定的阈值就不进行聚类分析,而不必象一些分层聚类方法那样直至合并到只剩下一个类为止的情况,这样做加快了聚集速度!该算法的时间复杂度为 (&70$.&)!E-电子学报.LL.年!#$%&$(#)#&*#+,算法的处理步骤如下:输入:!个类输出:类层次结构#$%&-!个类的集合;(&)*(-+;./#$0 有相似度大于某一指定的阈值并且(&)*(大于 1 使用余弦相似性公式,分别计算
16、#$%&中的类之间的相似度;按照相似度,把相似的类作为集合%&中的一个元素;#$%&-%&;,$)-)#2(*(%&);.)#2(*函数是取出%&中的第一个元素./#$0%&3 4!)#),$)-中的类的相似度大于某一指定的阈值*/0,把,$)-中的类作为子类,并将,$)-中的类进行合并,获得它的父类/#$%;#$%&-#$%&5,$)-;.从#$%&中将已合并的这些类删除#$%&-#$%&6/#$%;,$)-,07*(%&);.,07*函数是取出%&中的下一个子类对(&)*(-(&)*(5 1;!#构造用户访问模式!#$单个文档中关键词的抽取算法%&()*+,-.)*8#,9$0(:;$0算
17、法是用来抽取单个文档的关键词集主要是从一些频率较高的单词开始,根据每个单词的前后词找出相互关联的词组或短语,最终构成一组关键词,这使得抽取关键词不需人工干预此外,为了提高自调节能力,本算法通过在每次循环中根据词组的聚集情况对最小支持度进行调整不同的是:8#,9$0(:;$0 算法在每次循环中根据词组的聚集情况对最小支持度进行调整,并结合抽取关键词的应用对=;2#+2#关联规则法进行改进,从而具有较好地自调节能力0该算法的时间复杂度为 1(2!)08#,9$0(:;$0 算法处理步骤如下:输入:单个文档输出:关键词集 按单个词进行词频统计并排序;剔除频率较高的介词,冠词等虚词;%&1-!)#;.
18、%&1 存放关键词集%&-剩余的前!个频率较高的单词;.!为给定的最大值34!-1;./#$0 34!-2.2 为词组中包含词的最大个数/-&54&!-!)#;63-7%-)#2(*(%&);.)#2(*函数是取出%&中的第一个元素./#$0%&3 4!)#/-&54&!-63-7%和上文中前 34!个词所组成的词组 6/-&54&!;/-&54&!-63-7%和下文中后 34!个词所组成的词组 6/-&54&!;63-7%-,07*(%&);.,07*函数是取出%&中的下一个元素!-!5 8;.8 视词组的大小进行调整,本算法 8-?%&-计算/-&54&!中频率较高的!个词组;.!为给定的
19、最大值%-!%-%5 8;.%为频率最高词组的数量%&?-计算/-&54&!中频率最高的%个词组;%&1-%&1!%&?;34!-34!6 1;!#构造用户访问模式的算法/0*,1*.023&)*由于用户的兴趣点可能不止一个,因此可能涉及到不同的类,所以生成用户访问模式比较困难0 本文提出使用 20A*0;2+)#$0 算法来构造用户访问模式0该用户访问模式由多个关键词集组成,每个关键词集表示用户的某一兴趣点,从而避免了一些系统中用户访问模式仅能反映用户单一兴趣的缺陷0为了提高自动化程度,本算法主要采用数据挖掘和机器学习等多种技术对日志文件,BC 参数中的信息以及用户发出的查询请求和用户已浏览
20、过的查询结果进行不断的分析和训练,最终获得用户访问模式0这样做避免了一些系统要求用户输入自己的信息需求或者采用机器学习技术要求用户提供反馈信息进行训练所造成的自动化程度不太高的缺陷0为了减少用户访问模式算法的复杂度,本算法采用对页面上的信息进行语法分析等启发式规则来构造关键词集0为了有较好的自适应性,本算法通过对用户访问模式中关键词集的添加和删除来修改用户访问模式的内容,从而使用户访问模式更好地适应用户的动态需求变化0该算法的时间复杂度为 1(!D)020*0;2+)#$0 算法处理步骤如下:输入:某一用户使用的文档集%&输出:生成用户访问模式%$8,#&-)#2(*(%&);.)#2(*函数
21、是取出%&中的第一个文档./#$0 文档集%&3 4!)#)文档%$8,#&中已有的多个关键词*/0,这些关键词构成关键词集;0$(0#)找出文档%$8,#&中隐含的信息*/0,对 EFGH 页面上的信息进行语法分析;#)出现标题字段中的内容(以 3(1 4 I 3(J 4 表示)或者出现下划线标记(以 3 4 4 表示)或者出现粗体标记(以 3 9 4 表示)或者出现强调标记(以 3%-3!*4 表示)或者出现斜体标记(以 3)4 表示)或者锚元素($!(3-&8&!)中隐含的信息*/0,对上述标记后的内容进行分析后获得多个关键词,构成关键词集;0$(0 使用 8#,9$0(:;$0 算
22、法来抽取文档%$8,#&的关键词集;#)已存在用户访问模式*/0,使用余弦相似性公式,求出该用户访问模式和从文档%$8,#&中获得关键词集之间的相似度;#)相似度小于某一指定的阈值*/0,使用 GKG 算法,找出文档%$8,#&和哪一类相似,获得该类的关键词集,将该关键词集并入用户访问模式;.对用户访问模式进行扩充0$(0 获得的关键词集构成用户访问模式;%$8,#&-,07*(%&);.,07*函数是取出%&中的下一个文档LL1第?期韩立新:一个面向 C,*02,0*的个性化信息检索系统模型!该用户访问模式中的某些关键词集不相似于所有文档#$%&删除这些关键词集;!删除用户访问模式中过时的关
23、键词集!算法性能分析使用!&()%*+,-)%算法对下面各个站点的.%/文档进行测试,测试情况如表 0 所示表 使用!&()%*+,-)%算法的实验结果站点名抽取的文件数抽取的文件量(12)平均关键词数获得关键词集准确的文档数关键词集的正确率3*!&($4+5%6457&89:;85=8(!5%64;9?=;8=#A+B*$+)5%6489:=C8:=;:;#D&(B54,65%64=98;C:?9#依次对表中的网站进行实验从实验结果中可以看出:本算法获得的关键词集较准确,这主要是由于采用从一些频率较高的单词开始,根据每个单词的前后词找出相互关联的词组或短语,最终构成一组关键词的方法此外,随着
24、抽取文件数的不断增加,关键词集的正确率也在不断增加因为在最初查找关键词时,由于没有预先将一些常用的词存放在库中,结果造成频率较高的介词冠词等虚词被误认为是关键词,从而影响了关键词集的正确率随着抽取文件数的不断增加,库中的常用词不断增加,从而正确率也随之上升使用 EB%+#%-BF!)%算法对下面各个站点的.%/文档进行测试,测试情况如表 C 所示表#使用 EB%+#%-BF!)%算法的实验结果实验结果实验项目分别在一个网站上进行的实验综合在多个网站上进行的实验测试文档平均长度005012095C12测试文档数=9C9得出结论的文档数C0成功率5:#9#结果准确的文档数C808准确率?C5=#:
25、5;#注:这些网站是 G+$FF,金陵热线,中国教育和科研计算机网从实验结果可以看出:成功率并不很高,但准确率还是比较高的这主要是一些测试文档并不是用户感兴趣的信息,而是用户随机浏览的信息但当我们剔除用户并不感兴趣的文档后,从用户感兴趣的文档中构造用户访问模式,所产生的准确率还是比较高的准确率比较高的具体原因是由于采用数据挖掘和机器学习等多种技术对日志文件,EHI 参数中的信息以及用户发出的查询请求和用户已浏览过的查询结果进行不断的分析和训练,最终获得用户访问模式的方法此外,实验在一个网站上进行比实验在多个网站上进行准确率高,这是因为从同一网站上的一些 JD2 文档中抽取关键词可能更为容易,因
26、为有时这些 JD2 文档中的关键词可能用相同或相似的颜色、字体$与国内外同类工作的比较与一些个性化信息检索系统模型相比,本原型系统把用户访问模式,类层次结构和关键词等多种方式结合起来构造个性化信息检索系统,从而更好地满足用户复杂的需求并且可以为用户提供交流合作的机制,实现人机优势互补在文献 0,C 中,因为用户可能有多方面的兴趣,所以无法很好地形成用户访问模式的层次结构而本原型系统提出用户访问模式和类层次结构相结合的方法可以较好地解决这一问题由于在多 K(%系统中主要存在一个通讯和协调的问题,现有的一些多 K(%系统大多采用集中式的管理模式L即在系统中有一个固定的管理器,所有 K(%&
27、#的通讯或请求都要通过这个管理器来协调L一旦这个管理器崩溃,那么整个多代理系统也就瘫痪了,为了避免这个缺陷,我们对多 K(%系统的管理采用的是完全分布式的管理模式%结束语本文提出个性化检索和浏览式检索相结合的一个系统模型 M+B7$L从已发表的一些国内外文献来看,虽然在此方面已作了一些工作,但是我们的系统是通过对一系列关键技术的改进,从而使得系统的性能得到明显的提高L目前该系统的设计思想已运用在国家=高科技项目“N+O+开发环境的开发”的研制过程中,并且这一项目已通过了国家=专家组组织的鉴定和验收参考文献:0 3 P4B1!,NF1%)+,Q 4)F&%&,A 34B-%!&%&L K(%
28、*!&6%)!O%B!&(-%BR*F&+)!S%6 7F%/+*%6 F&*%,+!7,%#+6+#+K LI&MBF7L0?KKKI-B!&(T,-F*!4,JFB1*$F-F&I%)!(%K(%*!&ET/%B*-+7%E,#+&FB6,UK,0?:F)F(T/+*%6-%B*F&+)!S%6*%+B7$K LMBF7%6!&(*F#$%00#$IDDD I%B&+#!F&+)EF&%B%&7%F&3FF)*.!#$KB#!7!+)I%)!(%&7%E,0?L=3 G+&,X H+B7!+RAF)!&+LIY3R+#FF)FB.!6%R+B%+!&
29、FB,+#!F&6!*%,!R&+#!F&K LI&MBF7L0?;UDZI 3%7$&!7+)EF&E L0?;:0:V0L 8 Q 2+BB%#,M A+()!F,1%)%,L XF.#F-%B*F&+)!S%#$%J%/K L I&MBF7LKEA EXI?:E,K#)++,UK,0?:L;A)+6%&!7L M%B*F&+)J%/J+#7$%B:6%*!(&+&6!,-)%,%+#!F&Q L3%7$&!7+)Q%-FB#INRMR:8:C,NL#%+&I&*#!#4#%,%-+B#,%FB I%)R)!(%T*#%,*,_4/)_+&+,0?/_%7#*!&+B(
30、%7+)%3%W#MBF7%*!&(T*#%,K L MBF7%6!&(*F#$%I%B&+#!F&+)T,-FR*!4,F&!*#B!/4#%6/_%7#*+&6 K-)!7+#!F&*E,0?L:A M+SS+&!,N A4B+,+#*4,2!)*4*LT*1!)J%/%B#:!6%!T!&(!%B%*#R!&(.%/*!#%*K L I&MBF7L0=#$Z+#)L EF&L F&KB#!7!+)I%)!(%&7%E,0?L H A!)%BLJFB6Z%#:K)%W!7+)6+#+/+*%FB D&()!*$N LEF,4&!7+#!F&*F#$%KEA,0?;,=(00
31、):=?V 80L?E$!$RA!&(4,$!+&R$TF&(3*%&(,AF&RYF&(N!+&(,NF%E E$%&L K;0电子学报C99C 年!#$%$()*+,-)./(#0.)1$&*()#+2 3(4*+2()%$()#5 6 7+-)./6.0$8(9$8-/*0*/:5#*%.+0()(+/(.+;*+,,?)*+,()-)(#(ABBB):9CD E 9CF6AD 3 5,)G&,3?)*H+$6!#$&,.)*$84#0.)4*+*+,#./*$*.+)&(#5 67+-)./6.0$8(ID$8 7+$6%.+06.+J()K L),($M#(#(JL=BF)%
32、,?+$*,.,%8*&(,?(6ABBF:FNO E FBB6AAP2)2 Q.(+H4,1+.?$(,(4+,L4M()$?/8.4H()6?.)$*+,/.+$(+$)($)*(R&0).4 SSS R*M#*/&(R(&/$(,.)*(#5 6-)./(2:*+,#.+$8(II+2+&*+$()+$*.+&5%T?7U73/.+0()(+/(.+)(:#()/8+2 2(R(&.4(+$*+*+0.)4$*.+)($)*(R&%,ABBB:9AA E 9AI6AI T*/8(&V-WW+*63()(#(+$*.+.0(&(/$).+*/4*&0*&$()*+,).0*&(#:#()#
33、$2K 5 6-)./(2*+,#.0$8(IDDD*+$()+$*.+&/.+0()(+/(.+*+:$(&*,(+$#()*+$()0/(#%,IDDD:IDI E IDC6A9 胡舜耕,刘晓宇,钟义信6基于多 5,(+$技术的自动文摘系统的研究和设计V 6电子学报,IDDA,IB(I):IFN E IFB6作者简介:韩立新男,ABCN 年生于江苏南京,南京大学计算机系博士研究生6 主要研究方向:数据挖掘和分布式计算6陈贵海男,ABC9 年生于广西贵县6 南京大学计算机系教授、博士生导师6主要研究方向:分布与并行系统,网络计算!6中医舌像分析仪(北京工业大学信号与信息处理研究室)北京工业大
34、学信号与信息处理研究室与北京市中医院合作开发的中医舌像分析仪已在北京市中医院投入使用,并在临床应用中得到了专家及用户的好评6其中部分关键技术已申请国家专利6中医舌像分析仪是一种无创、定量和客观的中医舌像智能分析仪器,为中医的临床诊断、教学和研究服务6它能够采集、察看、存储数字化彩色舌图像,实现彩色舌图像的真实重现,并具有自动分析常见舌像特征(舌色、苔色、苔厚、湿度、裂纹等)的功能6 中医舌像分析仪可以有效地提高舌诊的准确度、客观性和工作效率6中医舌像分析仪在标准化的采集环境下,采集舌图像并传送到计算机,实时地进行彩色校正、舌体分割、舌像特征自动分析,经过医生诊断,最后将舌图像、分析结果、医生的
35、诊断结果分类归档存储,通过高分辨率显示器或彩色打印机输出6可以快速检索查询病人信息,也可通过计算机网络共享医疗信息6中医舌像分析仪对提高舌诊理论水平和临床诊断能力,进一步丰富中医舌诊的医学宝库,开创中医舌诊的创新之路具有十分积极的意义6中医舌像分析仪外观图NXA第I期韩立新:一个面向 7+$()+($的个性化信息检索系统模型一个面向Internet的个性化信息检索系统模型一个面向Internet的个性化信息检索系统模型作者:韩立新,陈贵海,谢立作者单位:南京大学计算机软件新技术国家重点实验室,江苏南京,210093刊名:电子学报英文刊名:ACTA ELECTRONICA SINICA年,卷(期
36、):2002,30(2)被引用次数:26次 参考文献(13条)参考文献(13条)1.T Kurki.S Jokela.R Sulonen.M Turpeinen Agents in delivering personalized content based on semanticmetadata 19992.Alexander Pretschner.Susan Gauch Ontology based personalized search 19983.T Yan.H Garcia-Molina SIFT-a tool for wide-area information disseminati
37、on 19954.R Barrett.P Maglio.D kellem How to personalize the Web 19975.D Mladenic Personal WebWatcher:design and implementation 19986.Ismael Sanz.Luigi Mazzucchelli Distributed Objects in a Large Scale Text Processing System 19987.M Pazzani.J Muramatsu.D Billsus Syskill&Webert:identifying interesting
38、 web sites 19968.G Miller WordNet:A lexical database for English 1995(11)9.Chih-Ming Su.Shian-Shyong Tseng.Mon-Fong Jiang.Joe C S Chen A Fast Clustering Process for Outliersand Remainder Clusters 199910.R Agrawal.R Srikant Fast algorithms for mining association rules 199411.Eduard Hoenkamp.Onno Steg
39、eman.Lambert Schomaker Supporting content retrieval from WWW via basiclevel categories 199912.Michael J Pazzani Representation of electronic mail filtering profiles:a user study 200013.胡舜耕.刘晓宇.钟义信 基于多Agent技术的自动文摘系统的研究和设计期刊论文-电子学报 2001(02)引证文献(24条)引证文献(24条)1.杨艺.唐灿.杨琛 一种启发式Web信息检索方法期刊论文-重庆工商大学学报(自然科学版
40、)2010(2)2.杨勇军 基于多智能Agent计算机科学信息检索个性化服务的探讨期刊论文-内蒙古科技与经济 2009(4)3.岳文.陈治平.林亚平 基于查询扩展和分类的信息检索算法期刊论文-系统仿真学报 2006(7)4.基于网格的信息检索系统体系结构研究期刊论文-现代情报 2006(7)5.徐科.崔志明 基于搜索历史的用户兴趣模型的研究期刊论文-计算机技术与发展 2006(5)6.吴丽华.罗云锋.张宏斌 信息检索模型及相关性算法的研究期刊论文-情报杂志 2006(12)7.苑兆忠.姜华 Web挖掘技术在信息检索中的应用研究期刊论文-聊城大学学报(自然科学版)2006(1)8.徐义峰.徐云青
41、.刘晓平 一种基于时间序列性的推荐算法期刊论文-计算机系统应用 2006(10)9.岳文 信息检索算法在Web中的应用与研究学位论文硕士 200610.李培峰.朱巧明.杨蓓虹 协作信息平台中协作内容自动匹配方法的设计与实现期刊论文-南京大学学报(自然科学版)2005(z1)11.尹西杰 基于智能Agent的Web信息自动推送系统期刊论文-机电工程 2005(12)12.钟智.黄发良 基于个性化服务的元搜索引擎模型期刊论文-河北理工学院学报 2005(1)13.匡燕 基于.NET框架的制造业协作网站的设计与实现学位论文硕士 200514.杨蓓虹 基于企业协作信息网平台的信息检索系统的设计与实现学
42、位论文硕士 200515.李世明 专业搜索引擎中信息过滤的研究与实现学位论文硕士 200516.司卫国 基于移动Agent的Web信息检索系统的研究学位论文硕士 200517.钟敏娟.林亚平.陈治平 基于分类和关键词组抽取的信息检索算法期刊论文-系统仿真学报 2004(5)18.韩立新.谢立 一种从WEB上抽取信息的方法期刊论文-情报学报 2004(1)19.刘艳青.田萱.苏桂莲 基于Internet的个性化信息检索技术的研究期刊论文-计算机工程与设计 2004(5)20.刘艳青 基于Web的个性化信息检索研究学位论文硕士 200421.潘春华 中文农林信息资源主动推送服务研究学位论文硕士 200422.张宏斌.朱明富.陈德军 智能化搜索引擎技术的研究进展期刊论文-信息与控制 2003(6)23.韩立新.阳雪林.谢立.陈道蓄 一种提高WEB信息检索系统查准率的新方法期刊论文-情报学报 2002(5)24.韩立新.陆桑璐.谢立 一个面向Internet的分布式信息检索系统模型期刊论文-电子学报 2002(8)本文链接:http:/