《简述申请基金项目的主要内容、社会经济意义、目前的进展情况、申31474.docx》由会员分享,可在线阅读,更多相关《简述申请基金项目的主要内容、社会经济意义、目前的进展情况、申31474.docx(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高新技术企企业项目目可行性性分析报报告目录1.企业概概况51.1企业业基本情情况51.2科技技力量551.3产业业化及研研发环境境71.4企业业长远发发展规划划及目标标82.互联网网咨询协协调过虑虑器及智智能检索索支援系系统项目目论述992.1互联联网咨询询协调过过虑器及及智能检检索支援援系统技技术可行行性分析析92.1.11国际市市场现状状及产品品分析992.1.22智能检检索技术术的概述述102.1.22.1协协调过滤滤(Coollaaborratiive Fillterringg)技术术造就的的个性化化服务1102.1.22.2检检索服务务的个性性化2222.1.22.3自自动收集集技术
2、2222.1.22.4自自动定点点观测技技术2222.1.22.5系系统的综综合2332.1.22.6系系统的运运用形态态232.2互联联网咨询询协调过过虑器及及智能检检索支援援系统市市场调查查和需求求预测2252.3项目目实施方方案2662.3.11开发实实施方案案262.3.22营销计计划实施施方案2282.4项目目实施目目标2882.5投资资估算2282.6经济济、社会会效益分分析2882.7项目目可行性性分析结结论2884 管理信信息化系系统通用用化平台台及业务务逻辑自自动生成成工具系系统项目目论述2294.1 管管理信息息化系统统通用化化平台及及业务逻逻辑自动动生成工工具系统统技术可
3、可行性分分析2994.1.11 开发发背景2294.1.22 平台台模式2294.1.33 开发发方案3314.2 管管理信息息化系统统通用化化平台及及业务逻逻辑自动动生成工工具系统统市场调调查和需需求预测测334.3项目目实施方方案3334.3.11 开发发实施方方案3334.3.22 营销销计划实实施方案案334.4 项项目实施施目标3334.5 投投资估算算344.6 经经济、社社会效益益分析3344.7 项项目可行行性分析析结论334WBT(Webb-Baasedd Trrainningg)系统统项目论论述355.1 WWBT(Webb-Baasedd Trrainningg)系统统技
4、术可可行性分分析3555.1.11 WBBT系统统的诞生生背景3355.1.22 计算算机辅助助教学的的理论3365.1.22.1 建构主主义学习习与教学学理论在在计算机机辅助教教学中的的实现模模式3665.1.22.2 计算机机辅助教教学的现现有模式式37(1) CCBT(Commputter-Bassed Traainiing)模式377(2) 初初级WWWW模式式37(3) 具具有管理理机能的的WWWW模式388(4) 统统一规格格的具有有管理机机能的WWWW模模式3885.1.22.3 WBTT(Webb-Baasedd Trrainningg)系统统模式的的规格339(1) AAIC
5、CC(Aviiatiion Inddusttry CBTT Coommiitteee)39(2) IIMS(Insstruuctiionaal MManaagemmentt Syysteem)39(3) IIEEEE LTTSC(Leaarniing tecchnoologgy SStanndarrds Commmittteee)39(4) AADLNNet(Advvancced Disstriibutted Leaarniing)40(5) WWBT(Webb-Baasedd Trrainningg)系统统模式规规格之间间的关系系405.1.33 WBBT系统统的构成成理论4415.1.33
6、.1 CMII的管理理体系4415.1.33.2 WBTT规格下下的CMMI等级级425.1.33.3 CBTT机能4225.1.33.4 CBTT,CMMI的界界面4225.1.33.5WWBT系系统实装装形态4435.1.44 WBBT的应应用范围围475.1.55 WBBT的特特点4885.1.66 WBBT发展展现状4485.2 WWBT系系统的构构筑平台台系统市市场调查查和需求求预测4485.3项目目实施方方案4885.3.11 开发发实施方方案4885.3.22 营销销计划实实施方案案495.4 项项目实施施目标4495.5 投投资估算算495.6 经经济、社社会效益益分析4495
7、.7 项项目可行行性分析析结论4491. 企业概况1.1 企业基本情情况公司是是一家由由海外归归国人员员和国内内的计算算机界精精英共同同创办的的追求高高科技、重重视实际际应用的的公司。企业的法定定地址为为公司现现有员工工人人。注册资金为为人人民币、总总资产为为人人民币。企业登记注注册类型型有限责责任公司司。1.2 科技力量(1) 主主要人员员构成情情况职务姓名学历主要经历技术专长王立群博士1 19880至119844 西安电电子科技技大学2 19884至119899 中国计计算机系系统工程程研究所所3 19889至119900 日本日日立制作作所4 19990至119922 夏普多多媒体研研究
8、所5 19992至119944 富士通通网络事事业部6 19995至119966 日本NNTT软软件公司司7 19997至220000 日本NNTT通通信研究究所8 20000至220011日本共达网网络有限限公司9 20001至220022-2 北京共共达公司司总经理理计算机操作作系统,计计算机应应用系统统(物流流系统,MMIS系系统,CCRM系系统,MMRP系系统),计计算机图图像处理理,计算算机通信信技术,互互联网技技术,软软件工程程。高洋大学本科1 19994至119988 北京大大学2 19998-88至20001-5 日本UUNSYYS有限限公司3 20001-66至20002-2
9、 北京共共达公司司董事兼兼系统开开发部部部长计算机操作作系统,计计算机应应用系统统(物流流系统,MMIS系系统,CCRM系系统,MMRP系系统),计计算机图图像处理理,计算算机通信信技术,互互联网技技术,软软件工程程。李发春大学本科1 19994至119988 北京大大学2 20000-88至20001-6 日本共共达网络络有限公公司3 20001-66至20002-2 北京共共达公司司董事兼兼总工程程师计算机操作作系统,计计算机应应用系统统(物流流系统,MMIS系系统,CCRM系系统,MMRP系系统),计计算机图图像处理理,计算算机通信信技术,互互联网技技术,软软件工程程。吴涛硕士1 199
10、94至119988 北京大大学2 19998至220011-4 中国科科学院3 20001-55至20002-2 北京共共达公司司产品开开发科科科长计算机操作作系统,计计算机应应用系统统(物流流系统,MMIS系系统,CCRM系系统,MMRP系系统),计计算机图图像处理理,计算算机通信信技术,互互联网技技术,软软件工程程。戴永继大学本科1 19994至119988 中国北北京大学学2 19998至220000-5 中国石石油化工工研究院院3 20000-55至20000-4日本共达网网络有限限公司4 20000-44至20002-2北京共达公公司工程程开发科科科长计算机操作作系统,计计算机应应用
11、系统统(物流流系统,MMIS系系统,CCRM系系统,MMRP系系统),计计算机图图像处理理,计算算机通信信技术,互互联网技技术,软软件工程程。公司的主要要人员均均具有良良好的基基础知识识和理论论知识,并并具有较较长时间间的国内内外研究究开发实实践,具具有良好好的外语语水平。不不断关注注掌握国国外技术术新动向向,同中中国具体体实际相相结合,开开发出符符合实际际需求的的实用产产品,是是我们追追求的目目标。(2) 企企业科研研队伍知知识结构构、人数数、科技技成果、新新产品开开发情况况。公司现有科科研开发发人员*名,均均具有大大学本科科以上的的学历。并并伴随公公司的发发展,计计划从现现地陆续续招收优优
12、秀人才才。公司的主要要人员通通过多年年的研究究开发实实践,通通过长年年学习和和调查的的日积月月累,通通过较长长时间的的讨论和和实验,已已积累了了下述22个项目目的大量量资料和和代码。公公司准备备用1到到2年的的时间,在在承接企企业信息息化建设设项目的的同时,完完成这22个项目目的产品品化。项目1:互互联网咨咨询协调调过虑器器及智能能检索支支援系统统项目2:管管理信息息化系统统通用化化平台及及业务逻逻辑自动动生成工工具系统统1.3 产业化及研研发环境境企业生产地地址、研研发地址址研发环境主主要是计计算机及及其关联联设备。1.4 企业长远发发展规划划及目标标前2年为稳稳定基盘盘阶段,后2年年以扩大
13、大发展为为中心。第一年第二年第三年第四年人数10人20人30人40人销售额(RRMB)180万250万500万1000万万第一年以我我们利用用业余时时间开发发的企业业网构筑筑框架为为中心,承接国国内的企企业网开开发项目目,并不不断完善善企业网网构筑框框架,使使其成为为管理信信息化系系统通用用化平台台及业务务逻辑自自动生成成工具。自主产品首首先以管管理信息息化系统统通用化化平台及及业务逻逻辑自动动生成工工具和互互联网咨咨询协调调过虑器器及智能能检索支支援系统统为主进进行投入入开发。2. 互联网咨询询协调过过虑器及及智能检检索支援援系统项项目论述述2.1 互联网咨询询协调过过虑器及及智能检检索支援
14、援系统技技术可行行性分析析2.1.1 国际市场现现状及产产品分析析人类进入二二十世纪纪之后,有有2种不不同概念念的高速速公路得得到了迅迅猛的发发展。这这2种不不同的高高速公路路,极大大地改变变了人类类的生活活方式以以及思维维方法。其其中,一一种是现现实生活活中交通通环境的的高速公公路车辆行行驶的高高速公路路(Hiighwway),另另一种是是信息社社会中的的交通要要道情报高高速公路路(Innforrmattionn Hiighwway)。由于计算机机技术的的迅速普普及和WWWW技技术即互互联网技技术的不不断进化化,情报报高速公公路得到到了前所所未有的的促进和和发展。与与此同时时,情报报高速公公
15、路的完完善反过过来也极极大地促促进并影影响了计计算机技技术和互互联网技技术的进进一步普普及。这这种互相相促进互互相补充充的关系系,终于于造成了了本世纪纪“工业革革命”的爆发发。据截止到220000年122月311日的统统计表明明,中国国国内连连接到互互联网上上的计算算机数达达到了8892万万台。IISP(IInteerneet SServvicee Prroviiderr,互联联网服务务商)和和ICPP(Innterrnett Coommeercee Prroviiderr,互联联网商务务贸易商商)的数数目达到到了数万万个,其其客户数数达到了了22550万人人。到年,我我国联网网计算机机将达到
16、到万台台,数据据、多媒媒体和互互联网用用户将达达到亿亿户左右右,上网网人口普普及率将将达到左左右。但另一方面面,从至至今为止止ISPP所能掌掌握的技技术和其其所能提提供的服服务来看看,各家家之间并并没有实实质性的的不同。因因此,各各家服务务商围绕绕着通信信速度、用用户所能能享受的的磁盘空空间、特特别是上上网价格格方面,展展开了激激烈的竞竞争。随随着硬件件成本的的不断下下降,最最终必将将导致价价格之战战的恶性性循环。纵观互联网网的发展展过程,可可以得出出以下的的结论:没有鲜鲜明特色色的ISSP,必必然会被被时代所所淘汰。因因此,经经济概念念上的IISP必必将向AASP(AAppllicaatio
17、on SServvicee Prroviide,应应用服务务商)的的方向进进化,这这也就是是ASPP成为现现今的热热门话题题的最重重要的原原因,也也就是说说能提供供满足用用户千变变万化的的要求的的真正的的服务才才能获得得生存的的空间。据某些分析析资料,在在二十一一世纪IIT产业业将流行行三个不不同的CC。第一一个C是是EC(EElecctroonicc Coommeercee,电子子商务)。第第二个CC是Coommuuniccatiion(情情报交流流)。第第三个CC是Cuustoomizze(灵灵活多变变)。在在本可行行性报告告中提到到的互联联网咨询询协调过过虑器及及智能检检索支援援系统的的
18、着眼点点直接涉涉及到了了Commmunnicaatioon和CCusttomiize,并并间接影影响到了了Eleectrroniic CCommmercce。这这个系统统的目标标是把强强大的生生命注入入到ISSP中去去,使其其进化成成具有鲜鲜明个性性的ASSP,从从而使单单纯的价价格之战战转化为为互联网网服务内内容和水水平的高高层次的的胜负较较量。2.1.2 智能检索技技术的概概述2.1.2.1 协调过滤(Colllabboraativve FFiltteriing)技术造造就的个个性化服服务背景:当今世界,随随着网络络技术的的发展,诸诸如WWWW,NNetnnewss,Maailiing l
19、isst等各各种各样样的情报报源不断断涌现,使使得人们们有可能能从更多多的情报报源中收收集信息息。与此此同时,大大量的情情报造成成了信息息的爆炸炸,使人人们为了了获得所所需的情情报不得得不花费费大量宝宝贵的时时间,从从而使情情报收集集变得近近乎失去去了意义义。为解决这个个问题,出出现了各各种不同同的办法法和方案案。但同同时也存存在着共共同的问问题:l 想要获得的的情报虽虽然并不不存在,但但由于用用户无法法判断而而还在执执迷不悟悟地检索索;l 想要得到的的情报的的确存在在,然而而由于方方法不当当而找不不到这些些信息;l 在情报检索索过程中中,收集集到大量量的洪水水般的多多余情报报致使有有用的信信
20、息被淹淹没;至今为止,从从互联网网上获取取信息有有情报检检索、情情报过滤滤和浏览览等几种种方法。简简述如下下: 情报检索情报检索,即即对检索索关键字字不断调调整,判判断其检检索结果果并将其其反馈到到关键字字中去,最最后,特特定到所所需的情情报源之之上。用户所指定定的关键键字直接接影响到到数据库库的检索索。数据据库系统统将符合合条件的的数据抽抽取出来来送给用用户,由由用户自自己去判判断检索索结果的的满足度度。用户户的要求求得到满满足后,情情报检索索宣告结结束。否否则将会会再次修修正关键键字,再再度检索索数据库库力争逼逼近理想想的结果果。这个个处理周周而复始始,整个个过程就就形成了了人们所所熟知的
21、的情报检检索。对于情报检检索来说说,每个个用户,每每次检索索过程都都互不相相关,完完全是独独立的。也也就是说说关心同同一类情情报的用用户之间间并不能能交换情情报,所所以也无无法形成成信息共共有,情情报检索索的效率率完全依依赖于检检索者个个人的知知识和熟熟练程度度。 情报过滤情报过滤是是指对所所获得的的情报而而设定优优先度,比比如Maailiing lisst就是是一例。加加入者众众多的MMaillingg liist,一一个用户户在一天天之内完完全有可可能收到到1000件以上上的电子子邮件,而而用户查查看这些些邮件必必然要花花费大量量的时间间。情报报过滤就就是为解解决这个个问题而而发展出出的技
22、术术。情报过滤是是这样一一个过程程:用户户可以事事先指定定代表不不需要情情报的关关键字,过过滤系统统则将含含有这些些关键字字的信息息源排除除出去。除除此之外外,用户户亦可指指定所需需情报的的关键字字及优先先顺序,过过滤系统统将根据据这些要要求把收收集到的的情报标标上优先先顺序再再提供给给用户。情情报过滤滤系统就就是这样样一个选选择情报报的收集集方法。和情报检索索方法类类似,使使用情报报过滤系系统的用用户,相相互之间间是独立立的,无无法实行行有效地地情报共共享,也也做不到到高效率率的情报报收集。用用户根据据自己的的水平决决定关键键字,稍稍有不慎慎会导致致将实际际上所需需要的情情报拒之之门外。综综
23、上所述述,情报报过滤与与情报检检索相同同,欲实实现高效效的检索索必须具具有相当当的熟练练经验。 浏览浏览是指相相关于HHypeerteext(即即互联网网的网页页)的情情报收集集方法。一一个具体体的例子子就是大大家所熟熟悉的对对各种WWWW主主页的检检索。浏浏览的一一个特点点是某些些场合下下用户并并没有明明确的目目的,在在对各种种主页进进行浏览览的过程程中逐步步获得明明确目的的的情报报。浏览属于最最困难的的情报收收集方法法的一种种。首先先,用户户并不知知道他所所需的情情报是否否存在。其其次,用用户很可可能找不不到他所所需的情情报。用用户通过过各种连连接方式式(Liink)去去寻找情情报,但但对
24、Liink的的选择可可能导致致他离所所需情报报愈来愈愈远。这这个问题题的发生生,同样样是因为为浏览亦亦是相互互之间独独立进行行的缘故故。 因因此,从从上述网网上获取取情报的的3种方方法的说说明上可可以得出出结论,独独立进行行情报收收集的做做法,造造成了即即使是关关心同样样内容的的用户也也无法实实现情报报共有/共享。而而在现实实世界里里,对于于关心共共同话题题,共同同内容的的用户来来说,一一个最重重要的问问题就是是进行高高效的情情报交流流和共享享。但是是十分遗遗憾的是是传统的的手法实实现这种种共有/共享是是不可能能的。相相互间独独立的情情报收集集是现有有各种主主要检索索软件的的致命伤伤,是一一种
25、不可可取的方方式。互互联网的的发展,迫切需需要一个个用于信信息收集集、具有有智能的的检索支支援系统统。为解决上述述的问题题,出现现了协调调过滤这这样一种种崭新的的方法。协协调过滤滤法充分分利用了了他人的的知识进进行情报报收集。而而这些知知识常常常包含了了间接、甚甚至直接接解决问问题的重重要信息息。这种种做法大大大减少少了收集集情报所所需的时时间和工工作量。更更具体地地说,根根据用户户的爱好好和要求求,系统统自动提提供/推推荐各类类信息,也也即推荐荐服务(RRecoommeencee Seerviice)的的方法。以下是日本本的日日经网络络商务(Niikkeei NNet Bussineess)
26、举举办的第第9回互互联网用用户调查查的结果果(调查查期间119999年111月188日12月月2日)。调查提问.作为检检索服务务的一种种,以用用户输入入的检索索关键字字为基准准,向用用户介绍绍有关网网上商品品销售网网站(WWeb Sitte)的的推荐(RRecoommeencee)型服服务已经经开始了了。你想想使用这这类服务务吗?请选择下列列合适的的答案。回答年月1999年年12月月1999年年6月1998年年12月月还从未使用用过,看看起来很很方便,今今后想利利用。38.9%39.5%37.9%不知道是什什么样的的服务,无无法表态态。26.7%25.4%22.9%还从未使用用过,因因感到不不
27、必要,今今后也不不打算利利用。18.8%20.2%24.0%已经使用过过了,感感到很方方便,今今后也准准备继续续利用。11.2%10.4%9.8%已经使用过过了,感感到没必必要。今今后不再再利用了了。3.7%3.9%4.6%其他0.8%0.6%0.8% 互联联网活跃跃用户调调查(日日经BPP出版社社)据以上的调调查结果果,实际际上用过过情报推推荐服务务的用户户占全体体的144.9%,作为为刚开始始不久的的服务来来说这个个数字不不算什么么,但想想利用的的用户占占50.1%,将将全体的的一半。从从这个调调查结果果来看,推推荐服务务将在互互联网今今后的发发展中起起到举足足轻重的的作用。综上所述,在各
28、种种情报的的收集活活动中,通过使使用协调调技术,可可以提高高收集活活动的效效率。体体现协调调特点的的情报收收集的一一个例子子是maailiing lisst。关关心相同同内容的的用户参参加maailiing lisst,相相互之间间交换情情报。请请想象某某用户就就某个问问题向mmaillingg liist的的参加者者进行询询问,而而参加者者们或直直接回答答问题,或或提供能能对解决决问题有有帮助的的情报及及提示。这这个过程程即是一一个相互互协调的的过程。与与单独的的情报收收集相比比,相互互协调的的方法能能更有效效地提高高检索效效率。技术构成要要素协调过滤方方法是基基于情报报流通传传播,以以提高
29、收收集效率率为目标标的情报报收集的的方法。情情报流通通是指为持不同同问题的的用户自自动寻找找解决问问题的情情报;向持相同同问题的的用户提提供推荐荐服务;需要寻找找关注某某特定问问题的用用户群,进进而得到到为解决决问题所所必需的的信息。则是将这些用户的特征归纳起来,做到情报的交换。协调过滤方法则将上述的过程自然地融为一体。所以,我们可以为协调过滤做以下的定义。协调过滤(CColllaboorattivee Fiilteerinng):从人类的情情报收集集活动中中,归纳纳抽象出出其所对对应的爱爱好,关关心,意意图等形形态意识识,并通通过获取取的收集集情报及及归纳抽抽象出的的形态意意识,对对人类进进
30、行分类类,实现现类似人人类间的的情报交交换的手手段。另外,还有有各种各各样不同同的定义义方法。比比如,119966年出现现的协调调过滤法法研究系系统Grroupp leens(协协调过滤滤法最有有名的研研究系统统之一),其其开发者者之一PPaull Reesniick有有过如下下的说明明。“Guiddingg peeoplles cchoiicess off whhat to reaad,wwhatt too loook at,wwhatt too waatchh,whhat to lisstenn too (tthe fillterringg paart),aand doiing thaat
31、 gguiddancce bbasee onn innforrmattionn gaatheeredd frrom somme ootheer ppeopple(tthe colllabboraativve)。”可翻译成下下文:以从其其他用户户收集到到的情报报(协调调部)为为基础,向向每个利利用者提提供“应该读读什么”,“应该关关注什么么”,“应该看看些什么么”,“应该听听些什么么”等建议议(过滤滤部) 从从上述的的表述中中可以看看出,对对各种各各样的情情报来说说,人们们的评价价及这些些情报在在社会中中的影响响可以被被用来判判断情报报本身的的价值,以以及决定定是否值值得被推推荐,这这也就是是协
32、调过过滤法的的一个最最大的特特征。正正是基于于这点,有有时也称称其为社社会过滤滤法(SSociial Fillterringg)。 作为协调调过滤方方法的一一种,为为实现能能从洪水水般的情情报中抽抽取用户户必要的的信息,推荐系系统(RRecoommeencee Syysteem)常常备使用用。另外外,为能能实现利利用者爱爱好的自自动追踪踪及判断断,Aggentt系统(AAgennt ssysttem)技技术及人人工智能能技术的的研究利利用,也也有很大大的潜力力。 协调过滤滤法用到到的算法法有以下下几种:I Activve CColllaboorattivee Fiilteerinng(AACF
33、)最初的协调调过滤系系统是XXeroox公司司的PAARC研研究所的的电子邮邮件系统统,由DDaviid MMaltts等人人开发研研究的IInfoormaatioon TTapeestrry电子子邮件系系统,该该系统被被Lottus Nottes 中的PPrinnterr部分所所采用。该系统的特特点是:彼此相相识、指指定范围围内的用用户通过过相互指指定,可可以做到到指定人人与其认认可的某某一领域域专家(被指定定人)间的情情报同步步。II Autommateed CColllaboorattivee Fiilteerinng(AACF)正如其名称称所示,系系统会根根据用户户已有的的评价值值,对
34、尚尚未处理理的情报报进行自自动评价价(预测测),将将得分高高的情报报主动向向用户推推荐。自自动评价价的预测测值则是是根据其其他用户户和本用用户的评评价情报报,采用用皮尔森森相关系系数等相相关算法法而计算算出来的的。这种方法有有它的缺缺点。由由于归根根到底是是靠用户户的评价价值而进进行推荐荐的,如如果某个个情报谁谁也没进进行评价价则永远远得不到到推荐。另另一方面面,评价价数据不不足时推推荐的精精度也受受影响。另另外,情情报量和和用户数数(评价价数)差差距较大大时,难难以找到到附近的的用户等等。MIT(麻麻省理工工学院)的的音乐情情报推荐荐系统RRinggo,明明尼苏达达大学的的Nettnewws
35、推荐荐系统GGrouup llenss等许多多协调过过滤系统统都采用用了这一一种方法法。III Featuure Guiidedd Auutommateed CColllaboorattivee Fiilteerinng(FFGACCF)根据用户的的爱好,从从事的领领域各不不相同这这一现实实,采用用把作为为过滤对对象的项项目群赋赋予属性性情报,从从而缩小小问题的的范围,提提高推荐荐精度的的方法即即为FGGACFF法。FFireeflyy Neetwoorkss 公司司(现已已被MiicrooSofft公司司收购)的的Firreflly采用用了这个个方法。纯粹的ACCF基本本上不考考虑情报报的内
36、容容,在情情报量不不断增大大的时候候仍把各各种情报报一视同同仁,很很容易造造成错误误的推荐荐。另外外,存在在着随情情报量增增大计算算时间也也增加的的问题。为为解决这这些问题题,事先先把各种种情报通通过赋予予属性情情报的方方法进行行分类(FFeatturee Guuideed),根根据属性性情报分分组,将将爱好相相近,领领域类同同的有用用情报尽尽早地向向用户推推荐。IV Conteent-Bassed Colllabboraativve FFiltteriing当主要以WWeb网网页,NNetnnewss信息等等文章情情报作为为过滤处处理对象象的时候候,同时时结合情情报内容容(Coonteent
37、ss)过滤滤处理和和协调过过滤处理理两者长长处的作作法也逐逐步得到到了完善善和发展展。近年来,以以互联网网的各种种Webb网页作作为过滤滤处理对对象,从从文章中中出现的的各个关关键词组组出发,对对系统中中新登录录情报进进行预测测评价的的方法受受到了广广泛的关关注。通通过事先先将各种种情报分分组的方方法,达达到提高高协调过过滤处理理精度目目的的手手法得到到了引人人注目的的发展。斯坦福大学学(Sttanffordd Unniveersiity) 的产产品Faab,明明尼苏达达大学计计算机科科学工程程系(DDeptt. oof CCompputeer SScieencee annd EEngiine
38、eerinng aat tthe Uniiverrsitty oof MMinnnesoota)的Neet PPerccepttionns IInc.的产品品Fillterrbotts等都都是文章章情报基基础的协协调过滤滤系统的的例子。上面提到的的作为NNetnnewss的推荐荐系统GGrouupleens也也在把成成为推荐荐对象的的文章分分成Neewsggrouup方面面下了大大的力量量,所以以从广义义上也可可以说是是一个FFGACCF系统统。除此之外,世世界上各各大学和和公司也也在研究究利用情情报的属属性进行行多变量量解析的的Cluusteer分析析法自动动地把项项目分组组,从而而提高系系
39、统性能能和精度度。以上各种算算法的实实现,基基于大量量的传统统数学模模型,一一种算法法中可能能包含有有多种数数学模型型,也可可能是某某一算法法对应于于多种数数学模型型候补。从从类别上上可分成成类似算算法数学学模型,分分组算法法数学模模型,自自然语言言分析数数学模型型等三类类。关于这些数数学模型型情报,我们在在下一节节中有较较详细的的记述。协调过滤法法的特点点下表列出了了协调过过滤法的的主要特特点。优点缺点不依赖于情情报的内内容可解决仅靠靠一般方方法而解解决不了了的情报报过滤问问题初期评价的的问题(eearlly rrateer pprobblemm)单纯纯的协调调过滤法法不能对对新登录录的情报
40、报进行评评价预测测。另外外,对于于登录的的情报及及新注册册的用户户而言,推推荐的精精度较差差。易于发现重重要情报报互联网情报报内容(cconttentts)基基础上的的过滤法法是对所所有的情情报不加加区分,一一视同仁仁地处理理的。相相比之下下,协调调过滤法法,则可可自动判判别这些些情报是是否受到到广大用用户的认认可。稀薄性问题题(spparssityy pprobblemm)能使协调过过滤系统统正常发发挥作用用的理想想条件是是存在大大量的,得得到众多多用户评评价的情情报。但但现实往往往是只只能收集集到很少少一部分分受到评评价的情情报。评价情报的的反馈用户对情报报的评价价可将系系统运营营者的利利
41、益(如如判断登登载哪一一类广告告等)和和用户的的利益(获获得有益益情报)直直接连接接起来。孤独用户的的存在问问题(ggrayy shheepp)特别是在中中小规模模的网络络内使用用协调过过滤系统统时,有有可能存存在着与与多数用用户意见见不同的的孤独的的用户。结果不够明明确因为采用统统计学的的方法计计算预测测评价值值,所以以无法保保证1000%的的准确性性。由此此而造成成错误的的过滤。由上表可知知,想开开发成功功的制品品,就需需要扬长长避短,在在前述的的技术构构成要素素之上施施行细致致的调整整。可以以这样说说,怎样样将各种种技术要要素有机机地结合合成一个个完整的的系统,是是本系统统商品化化成败的
42、的关键。当今世界中中协调过过滤技术术的应用用现状近年来,做做为取代代传统的的想方设设法地搜搜索信息息的方法法,开始始出现了了一种从从情报源源主动向向用户提提供情报报的方法法,即推推荐服务务的方法法。更值值得注目目的是以以著名的的,规模模大的互互联网提提供商提提供的检检索引擎擎和电子子商务(EEC)服服务为中中心而逐逐步展开开的个人人服务。这这些服务务针对每每个用户户的不同同特点进进行调整整,从而而形成因因人而异异的情报报提供方方式。个性化服务务和一对对一服务务(OnnetoOnee Seerviice)具具有相同同的含义义。这类类服务建建立了WWeb网网页提供供商和用用户之间间一一对对应的关关
43、系,由由此出发发,进而而大幅度度提高服服务质量量。做为为推荐服服务和个个性化服服务的核核心技术术,协调调过滤技技术在119966年左右右就被研研究开发发出来了了。但目目前的现现实是该该技术的的研究开开发仍是是以美国国的大学学和研究究机构为为主。处理中使用用的各种种数学模模型系统内部使使用的算算法如下下所示,所所有算法法都属于于古典统统计学的的范畴之之内。i:类似算算法数学学模型 类类似算法法:对某个个对象而而言,从从对象集集合中找找出与其其相类似似的对象象的算法法. 以下下列出各各算法的的方程式式,并对对各个符符号一一一说明.i=(i1,i2,.,ip);j=(j1,j2,.,jp); (ma
44、xx,minn是的最大大值和最最小值) : iif (mn= = 00) theen = 0; eelsee = 1; 以下下的计算算结果为为的时时候,值值越小表表示二者者越类似似;计算算结果为为的时时候,值值越靠近近1表示示二者越越类似。 平均尤库里里多距离离的二乘乘法 平均距离法法 最大值距离离法 二值距离法法 Dice Coeeffiicieent法法 rij=22 x|Kijj|(|KKi|+|Kj|) Jaccaardsss ccoeffficciennt法 皮尔森相关关法ij= 限定皮尔森森相关法法ij= 斯皮尔曼相相关法 改良二值距距离法MapI (mn) = ccmnMapU
45、(mn) : if (mn= = 00) MapU (mn) = 00; elsse if (mn iin ttopNN ) /如如果为重重要属性性MapU (mn) =BIIG; /BIGG是大于于”1”的定数数。elseeMapU (mn) = SSMALLL; /SMAALL是是小于”1”的定数数。 dijj=1rijii :群群(Cllustteriing)算法 即即将相类类似的对对象归为为同一个个群的算算法.以下涉及的的7种群群算法都都将分两两步实现现.第一步:对对各个基基本要素素,使用用10种种距离计计算值之之一求出出二者之之间的距距离.距距离最近近的两个个基本要素成成为一个个新要素素.基本本要素被被称为叶叶,新要要素则被被称为分分支.第二步:实实行递归归处理.利用以以下的方方程式计计算出与与新要素素间的距距离,进进而生成成新要素素。 下下面用到到2个基基本方程程式,方方程式和和系数的的不同组组合形成成7种不不同形式式。dxc=adxa+bdxb+dab+|dxadxb (1)dxc2=adxa2+bdxb2+dab2+|dxa2dxb2 (22) 方方程式表表示从aa和出出发,生生成新要要素,并求出出与要素素的距距离。 群平均法利用方程式