基于语义分析的网络不良信息过滤算法研究概要课件.ppt

上传人:飞****2 文档编号:92252885 上传时间:2023-06-02 格式:PPT 页数:15 大小:1.10MB
返回 下载 相关 举报
基于语义分析的网络不良信息过滤算法研究概要课件.ppt_第1页
第1页 / 共15页
基于语义分析的网络不良信息过滤算法研究概要课件.ppt_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《基于语义分析的网络不良信息过滤算法研究概要课件.ppt》由会员分享,可在线阅读,更多相关《基于语义分析的网络不良信息过滤算法研究概要课件.ppt(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、基于语义分析的基于语义分析的基于语义分析的基于语义分析的网络不良信息过滤算法研究网络不良信息过滤算法研究网络不良信息过滤算法研究网络不良信息过滤算法研究 计算机科学与技术系计算机科学与技术系计算机科学与技术系计算机科学与技术系 吕吕吕吕 滨滨滨滨 黑龙江工程学院科学研究基金项目黑龙江工程学院科学研究基金项目 研究目的研究目的研究目的研究目的 针对网络信息安全审核的实际需要,研究针对网络信息安全审核的实际需要,研究针对网络信息安全审核的实际需要,研究针对网络信息安全审核的实际需要,研究一种基于语义分析的算法,实现对各种动一种基于语义分析的算法,实现对各种动一种基于语义分析的算法,实现对各种动一种

2、基于语义分析的算法,实现对各种动态更新的态更新的态更新的态更新的WebWeb页面、电子邮件、新闻发页面、电子邮件、新闻发页面、电子邮件、新闻发页面、电子邮件、新闻发布、布、布、布、BBSBBS论坛、论坛、论坛、论坛、BLOGBLOG等文本类短信息的等文本类短信息的等文本类短信息的等文本类短信息的自动安全审核。自动安全审核。自动安全审核。自动安全审核。研究的意义研究的意义研究的意义研究的意义 替代人工自动完成对上网前的信息安全替代人工自动完成对上网前的信息安全替代人工自动完成对上网前的信息安全替代人工自动完成对上网前的信息安全审核,实现全方位高效的信息监管,从审核,实现全方位高效的信息监管,从审

3、核,实现全方位高效的信息监管,从审核,实现全方位高效的信息监管,从信息源头解决有害信息入侵和传播的问信息源头解决有害信息入侵和传播的问信息源头解决有害信息入侵和传播的问信息源头解决有害信息入侵和传播的问题。题。题。题。在语义分析、模式识别等人工智能技术在语义分析、模式识别等人工智能技术在语义分析、模式识别等人工智能技术在语义分析、模式识别等人工智能技术领域开辟我们的研究方向,为今后深入领域开辟我们的研究方向,为今后深入领域开辟我们的研究方向,为今后深入领域开辟我们的研究方向,为今后深入开展这方面的研究奠定基础。开展这方面的研究奠定基础。开展这方面的研究奠定基础。开展这方面的研究奠定基础。技术背

4、景技术背景技术背景技术背景 本课题的研究涉及信息分析和过滤技术,是当本课题的研究涉及信息分析和过滤技术,是当本课题的研究涉及信息分析和过滤技术,是当本课题的研究涉及信息分析和过滤技术,是当前信息领域的研究热点。目前该领域的研究焦前信息领域的研究热点。目前该领域的研究焦前信息领域的研究热点。目前该领域的研究焦前信息领域的研究热点。目前该领域的研究焦点是数据挖掘和分类检索技术,其研究的最终点是数据挖掘和分类检索技术,其研究的最终点是数据挖掘和分类检索技术,其研究的最终点是数据挖掘和分类检索技术,其研究的最终目标就是要提供一种智能化的工具,从浩瀚的目标就是要提供一种智能化的工具,从浩瀚的目标就是要提

5、供一种智能化的工具,从浩瀚的目标就是要提供一种智能化的工具,从浩瀚的数据海洋中采集到用户需要的有用信息。数据海洋中采集到用户需要的有用信息。数据海洋中采集到用户需要的有用信息。数据海洋中采集到用户需要的有用信息。应用到信息安全领域就是根据对某种敏感信息应用到信息安全领域就是根据对某种敏感信息应用到信息安全领域就是根据对某种敏感信息应用到信息安全领域就是根据对某种敏感信息的特征描述或样本训练,获得识别这类信息的的特征描述或样本训练,获得识别这类信息的的特征描述或样本训练,获得识别这类信息的的特征描述或样本训练,获得识别这类信息的元数据并据此对网上传输的信息进行甄别,实元数据并据此对网上传输的信息

6、进行甄别,实元数据并据此对网上传输的信息进行甄别,实元数据并据此对网上传输的信息进行甄别,实现对有害信息的滤除或阻断,保证信息安全。现对有害信息的滤除或阻断,保证信息安全。现对有害信息的滤除或阻断,保证信息安全。现对有害信息的滤除或阻断,保证信息安全。目前对网络信息过滤的研究集中在特征信息提目前对网络信息过滤的研究集中在特征信息提目前对网络信息过滤的研究集中在特征信息提目前对网络信息过滤的研究集中在特征信息提取和自适应算法上。取和自适应算法上。取和自适应算法上。取和自适应算法上。研究现状研究现状研究现状研究现状文文文文本本本本过过过过滤滤滤滤技技技技术术术术基于规则方基于规则方基于规则方基于规

7、则方法法法法基于数理统基于数理统基于数理统基于数理统计方法计方法计方法计方法基于关键词或基于关键词或基于关键词或基于关键词或关键词表达式关键词表达式关键词表达式关键词表达式常见规则算法:RipperDecision TreeBoostingRough Set典型统计算法:BayesKNNRocchioSVMVSMa AND b OR c按给定的关键字查找,规则简单,查找速度快,命中率高,但准确率和召回率低,主要用于各种搜索引擎。按照固定规则或通过样本训练获得的规则生成规则库,再以某种匹配算法考核目标文本。速度快,命中率和准确率较高,目前主要用于防火墙、防病毒或垃圾邮件软件 基于统计方法是利用统

8、计学原理,通过大量正、反例样本计算推出结果,提取出必要的特征信息,并以此甄别目标文档。该方法智能化程度较高,可以获得较高的召回率和准确率,主要用于信息采集。几个重要研究机构几个重要研究机构几个重要研究机构几个重要研究机构 该领域目前在国内外有很多非常活跃的研该领域目前在国内外有很多非常活跃的研该领域目前在国内外有很多非常活跃的研该领域目前在国内外有很多非常活跃的研究机构,他们在信息过滤的理论和应用方究机构,他们在信息过滤的理论和应用方究机构,他们在信息过滤的理论和应用方究机构,他们在信息过滤的理论和应用方面都取得了一些很有价值的研究成果。面都取得了一些很有价值的研究成果。面都取得了一些很有价值

9、的研究成果。面都取得了一些很有价值的研究成果。重要国际学术会议重要国际学术会议重要国际学术会议重要国际学术会议 TREC(textTREC(text retrieval conference)retrieval conference)文本文本文本文本检索会议、检索会议、检索会议、检索会议、TDT(topicTDT(topic detection and detection and tracking)tracking)主题检测和跟踪会议,是由美主题检测和跟踪会议,是由美主题检测和跟踪会议,是由美主题检测和跟踪会议,是由美国国家标准技术局国国家标准技术局国国家标准技术局国国家标准技术局(NIST)

10、(NIST)和国防部高级和国防部高级和国防部高级和国防部高级研究计划局研究计划局研究计划局研究计划局(DARPA)(DARPA)组织召开的一年一度组织召开的一年一度组织召开的一年一度组织召开的一年一度的国际会议,是文本检索领域最权威的的国际会议,是文本检索领域最权威的的国际会议,是文本检索领域最权威的的国际会议,是文本检索领域最权威的国际会议,代表了当今世界文本检索领国际会议,代表了当今世界文本检索领国际会议,代表了当今世界文本检索领国际会议,代表了当今世界文本检索领域的最高水平。域的最高水平。域的最高水平。域的最高水平。研究内容研究内容 1 1、提取各种非法广告、垃圾邮件、垃圾短、提取各种非

11、法广告、垃圾邮件、垃圾短、提取各种非法广告、垃圾邮件、垃圾短、提取各种非法广告、垃圾邮件、垃圾短信、不良言论、攻击性等不良信息的共性和信、不良言论、攻击性等不良信息的共性和信、不良言论、攻击性等不良信息的共性和信、不良言论、攻击性等不良信息的共性和个性特征,确定检索方向和内容;个性特征,确定检索方向和内容;个性特征,确定检索方向和内容;个性特征,确定检索方向和内容;2 2、研究典型算法的适应性,分析存在的问、研究典型算法的适应性,分析存在的问、研究典型算法的适应性,分析存在的问、研究典型算法的适应性,分析存在的问题,根据既定的检测特征和检测来源以及检题,根据既定的检测特征和检测来源以及检题,根

12、据既定的检测特征和检测来源以及检题,根据既定的检测特征和检测来源以及检测过程可以在确认有害信息后立即终止的特测过程可以在确认有害信息后立即终止的特测过程可以在确认有害信息后立即终止的特测过程可以在确认有害信息后立即终止的特点,对算法加以改进和优化,满足本项目要点,对算法加以改进和优化,满足本项目要点,对算法加以改进和优化,满足本项目要点,对算法加以改进和优化,满足本项目要求。求。求。求。3 3、初步检验和测试新算法的过滤效果,进、初步检验和测试新算法的过滤效果,进、初步检验和测试新算法的过滤效果,进、初步检验和测试新算法的过滤效果,进一步调整和优化算法。一步调整和优化算法。一步调整和优化算法。

13、一步调整和优化算法。技术关键技术关键技术关键技术关键 在文本中提取出符合要求的特征信息。作为识在文本中提取出符合要求的特征信息。作为识在文本中提取出符合要求的特征信息。作为识在文本中提取出符合要求的特征信息。作为识别不良信息的特征信息,既要具有所有不良信别不良信息的特征信息,既要具有所有不良信别不良信息的特征信息,既要具有所有不良信别不良信息的特征信息,既要具有所有不良信息的共性特征,还要具有代表某类不良信息的息的共性特征,还要具有代表某类不良信息的息的共性特征,还要具有代表某类不良信息的息的共性特征,还要具有代表某类不良信息的个性特征,它们都是进行信息过滤的依据,也个性特征,它们都是进行信息

14、过滤的依据,也个性特征,它们都是进行信息过滤的依据,也个性特征,它们都是进行信息过滤的依据,也是影响过滤效果的重要因素。是影响过滤效果的重要因素。是影响过滤效果的重要因素。是影响过滤效果的重要因素。其次是匹配算法,它决定着系统的运行效率和其次是匹配算法,它决定着系统的运行效率和其次是匹配算法,它决定着系统的运行效率和其次是匹配算法,它决定着系统的运行效率和精度,实时检测强调较高的速度和准确性,因精度,实时检测强调较高的速度和准确性,因精度,实时检测强调较高的速度和准确性,因精度,实时检测强调较高的速度和准确性,因此必须设计与之相适应的匹配算法,简化检测此必须设计与之相适应的匹配算法,简化检测此

15、必须设计与之相适应的匹配算法,简化检测此必须设计与之相适应的匹配算法,简化检测规则,实现较高的运行效率。规则,实现较高的运行效率。规则,实现较高的运行效率。规则,实现较高的运行效率。研究思路和可行性分析研究思路和可行性分析研究思路和可行性分析研究思路和可行性分析 本项目以理论研究为主,运用统计分析方法,先抽象本项目以理论研究为主,运用统计分析方法,先抽象本项目以理论研究为主,运用统计分析方法,先抽象本项目以理论研究为主,运用统计分析方法,先抽象出研究对象的一般和个性特征,确定层次关系,在此出研究对象的一般和个性特征,确定层次关系,在此出研究对象的一般和个性特征,确定层次关系,在此出研究对象的一

16、般和个性特征,确定层次关系,在此基础上建立初始过滤算法的数学模型,再对此模型进基础上建立初始过滤算法的数学模型,再对此模型进基础上建立初始过滤算法的数学模型,再对此模型进基础上建立初始过滤算法的数学模型,再对此模型进行上机测试验证,根据测试结果反复修正和优化过滤行上机测试验证,根据测试结果反复修正和优化过滤行上机测试验证,根据测试结果反复修正和优化过滤行上机测试验证,根据测试结果反复修正和优化过滤算法,直至达到预期目标算法,直至达到预期目标算法,直至达到预期目标算法,直至达到预期目标 系统研究的样本分析、文本扫描、模式匹配以及数据系统研究的样本分析、文本扫描、模式匹配以及数据系统研究的样本分析

17、、文本扫描、模式匹配以及数据系统研究的样本分析、文本扫描、模式匹配以及数据处理的相关的技术问题已经有比较成熟的技术方案,处理的相关的技术问题已经有比较成熟的技术方案,处理的相关的技术问题已经有比较成熟的技术方案,处理的相关的技术问题已经有比较成熟的技术方案,对比现有技术和本研究要解决的问题,技术上已经没对比现有技术和本研究要解决的问题,技术上已经没对比现有技术和本研究要解决的问题,技术上已经没对比现有技术和本研究要解决的问题,技术上已经没有重大障碍。有重大障碍。有重大障碍。有重大障碍。本课题组前期已经作了大量的基础性工作,掌握了第本课题组前期已经作了大量的基础性工作,掌握了第本课题组前期已经作

18、了大量的基础性工作,掌握了第本课题组前期已经作了大量的基础性工作,掌握了第一手资料,明确了研究目标和技术关键,拟定了研究一手资料,明确了研究目标和技术关键,拟定了研究一手资料,明确了研究目标和技术关键,拟定了研究一手资料,明确了研究目标和技术关键,拟定了研究方法和技术路线,制定了较详细的技术方案,这些工方法和技术路线,制定了较详细的技术方案,这些工方法和技术路线,制定了较详细的技术方案,这些工方法和技术路线,制定了较详细的技术方案,这些工作可以保证项目的顺利进行。作可以保证项目的顺利进行。作可以保证项目的顺利进行。作可以保证项目的顺利进行。特色与创新特色与创新特色与创新特色与创新 基于语义分析

19、的技术是本项研究的最大基于语义分析的技术是本项研究的最大基于语义分析的技术是本项研究的最大基于语义分析的技术是本项研究的最大特点,相比基于简单规则的过滤技术,特点,相比基于简单规则的过滤技术,特点,相比基于简单规则的过滤技术,特点,相比基于简单规则的过滤技术,它的智能化程度更高,因此更有实用价它的智能化程度更高,因此更有实用价它的智能化程度更高,因此更有实用价它的智能化程度更高,因此更有实用价值。值。值。值。算法是软件知识产权的核心内容,因此算法是软件知识产权的核心内容,因此算法是软件知识产权的核心内容,因此算法是软件知识产权的核心内容,因此算法研究更具有挑战性和创新性。算法研究更具有挑战性和

20、创新性。算法研究更具有挑战性和创新性。算法研究更具有挑战性和创新性。将基于文本内容的信息过滤技术用于信将基于文本内容的信息过滤技术用于信将基于文本内容的信息过滤技术用于信将基于文本内容的信息过滤技术用于信息安全领域具有重要意义和广阔的市场息安全领域具有重要意义和广阔的市场息安全领域具有重要意义和广阔的市场息安全领域具有重要意义和广阔的市场前景,所以本研究具有较高的社会效益前景,所以本研究具有较高的社会效益前景,所以本研究具有较高的社会效益前景,所以本研究具有较高的社会效益和经济效益。和经济效益。和经济效益。和经济效益。预期成果预期成果预期成果预期成果 在国内外公开发行的期刊上发表研究论文在国内

21、外公开发行的期刊上发表研究论文在国内外公开发行的期刊上发表研究论文在国内外公开发行的期刊上发表研究论文一篇至二篇一篇至二篇一篇至二篇一篇至二篇 写出代表过滤算法的核心代码写出代表过滤算法的核心代码写出代表过滤算法的核心代码写出代表过滤算法的核心代码 提交完整的研究报告提交完整的研究报告提交完整的研究报告提交完整的研究报告预期研究进展及经费预算预期研究进展及经费预算 项目的进度安排:项目的进度安排:项目的进度安排:项目的进度安排:20072007年年年年1 1月月月月-2007-2007年年年年3 3月:数据采集和调研,月:数据采集和调研,月:数据采集和调研,月:数据采集和调研,制定研究方案设计

22、。制定研究方案设计。制定研究方案设计。制定研究方案设计。20072007年年年年4 4月月月月-2007-2007年年年年1010月:建立数学模型。月:建立数学模型。月:建立数学模型。月:建立数学模型。20072007年年年年1111月月月月-2008-2008年年年年3 3月:编写程序,进行模月:编写程序,进行模月:编写程序,进行模月:编写程序,进行模拟计算、计算结果验证和结果分析。拟计算、计算结果验证和结果分析。拟计算、计算结果验证和结果分析。拟计算、计算结果验证和结果分析。20082008年年年年4 4月月月月-2008-2008年年年年6 6月:撰写研究报告,结月:撰写研究报告,结月:

23、撰写研究报告,结月:撰写研究报告,结题。题。题。题。经费预算:经费预算:经费预算:经费预算:研究团队研究团队研究团队研究团队 本课题组由六名本课题组由六名本课题组由六名本课题组由六名3535以下青年教师和以下青年教师和以下青年教师和以下青年教师和4 4名名名名0303级学生组成。通过本课题的研究可以把科级学生组成。通过本课题的研究可以把科级学生组成。通过本课题的研究可以把科级学生组成。通过本课题的研究可以把科研和指导学生毕业设计结合起来。研和指导学生毕业设计结合起来。研和指导学生毕业设计结合起来。研和指导学生毕业设计结合起来。本课题组的教师成员长期从事计算机应用本课题组的教师成员长期从事计算机

24、应用本课题组的教师成员长期从事计算机应用本课题组的教师成员长期从事计算机应用领域的教学、科研和指导毕业设计工作,领域的教学、科研和指导毕业设计工作,领域的教学、科研和指导毕业设计工作,领域的教学、科研和指导毕业设计工作,具有坚实的理论基础和相关课题的研究经具有坚实的理论基础和相关课题的研究经具有坚实的理论基础和相关课题的研究经具有坚实的理论基础和相关课题的研究经验,有能力完成本课题的研究工作。验,有能力完成本课题的研究工作。验,有能力完成本课题的研究工作。验,有能力完成本课题的研究工作。主要参考文献主要参考文献主要参考文献主要参考文献1 URI HANANI,etc.Information F

25、iltering:Overview of Issues,Research and Systems.User Modeling and User-Adapted 1 URI HANANI,etc.Information Filtering:Overview of Issues,Research and Systems.User Modeling and User-Adapted Interaction 11:203259,2001Interaction 11:203259,20012 W.Cohen,“Fast effective rule induction”,in Machine Learn

26、ing:Proceedings of the Twelfth International Conference,Lake 2 W.Cohen,“Fast effective rule induction”,in Machine Learning:Proceedings of the Twelfth International Conference,Lake TahoTaho,California,California,MonganMongan KanfmannKanfmann,pp.115-123,1995C,pp.115-123,1995C 3 Quinlan J 3 Quinlan J R

27、,InductionR,Induction of decision of decision trees,Machinetrees,Machine Learning,1986,(1):81-106.Learning,1986,(1):81-106.4 J.R.Quinlan,C4.5:Programs for Machine 4 J.R.Quinlan,C4.5:Programs for Machine Learning,SanLearning,San Mateo,Calif:MorganMateo,Calif:Morgan Kaufmann,1993 Kaufmann,199355于玲于玲于玲

28、于玲,吴铁军吴铁军吴铁军吴铁军.集成学习集成学习集成学习集成学习:Boosting:Boosting算法综述算法综述算法综述算法综述J.J.模式识别与人工智能模式识别与人工智能模式识别与人工智能模式识别与人工智能,2004,17(1):52-59.,2004,17(1):52-59.66王海川王海川王海川王海川,张丽明张丽明张丽明张丽明.一种新的一种新的一种新的一种新的AdaboostAdaboost训练算法训练算法训练算法训练算法J.J.复旦学报复旦学报复旦学报复旦学报(自然科学版自然科学版自然科学版自然科学版),2004,43(1):27-32.),2004,43(1):27-32.7 7

29、 PawlakPawlak Z ZRough setstheoretical aspects of reasoning about dataRough setstheoretical aspects of reasoning about dataKluwerKluwer Academic Publishers,Dordrecht,1991 Academic Publishers,Dordrecht,19918 8 梁久祯,自适应加速梁久祯,自适应加速梁久祯,自适应加速梁久祯,自适应加速BayesBayes方法在文本分类中的应用,方法在文本分类中的应用,方法在文本分类中的应用,方法在文本分类中的

30、应用,20032003年全国理论计算机科学学术年会年全国理论计算机科学学术年会年全国理论计算机科学学术年会年全国理论计算机科学学术年会论文集,论文集,论文集,论文集,20032003年年年年88月月月月9 9 WeifengWeifeng Su,Cross-Language Text Filtering Based on Text Concepts and Su,Cross-Language Text Filtering Based on Text Concepts and kNNkNN,Computational Linguistics and Chinese Computational L

31、inguistics and Chinese Language Processing Vol.7,No.1,February 2002,pp.79-90Language Processing Vol.7,No.1,February 2002,pp.79-901010黄萱菁等,基于向量空间模型的文本过滤系统黄萱菁等,基于向量空间模型的文本过滤系统黄萱菁等,基于向量空间模型的文本过滤系统黄萱菁等,基于向量空间模型的文本过滤系统.软件学报软件学报软件学报软件学报.13.13卷卷卷卷44期期期期.2002.200211 11 武旭、须德,基于向量空间模型的文本自动分类系统的研究与实现,北方交通大学学报

32、,武旭、须德,基于向量空间模型的文本自动分类系统的研究与实现,北方交通大学学报,武旭、须德,基于向量空间模型的文本自动分类系统的研究与实现,北方交通大学学报,武旭、须德,基于向量空间模型的文本自动分类系统的研究与实现,北方交通大学学报,Vol.27 No.2 2003Vol.27 No.2 2003年年年年44月月月月12 12 庞剑锋庞剑锋庞剑锋庞剑锋(Pang(Pang jianfengjianfeng)卜东波卜东波卜东波卜东波(Bu(Bu dongbodongbo)白硕白硕白硕白硕(BaiBai shuoshuo),基于向量空间模型的文本自动分类系统的研究与实现,基于向量空间模型的文本自

33、动分类系统的研究与实现,基于向量空间模型的文本自动分类系统的研究与实现,基于向量空间模型的文本自动分类系统的研究与实现,20032003年全国理年全国理年全国理年全国理论计算机科学学术年会论计算机科学学术年会论计算机科学学术年会论计算机科学学术年会论文集,论文集,论文集,论文集,20032003年年年年88月月月月13 N.13 N.LittlestoneLittlestone.Learning quickly when irrelevant attributes abound:Anew linear threshold algorithm.Machine Learning,2:.Learni

34、ng quickly when irrelevant attributes abound:Anew linear threshold algorithm.Machine Learning,2:285-318.1988285-318.198814 N 14 N CanceddaCancedda et al.Kernel methods for document filtering.Report at TREC-11,2002.et al.Kernel methods for document filtering.Report at TREC-11,2002.15 S E Robertson,S

35、Walker,H 15 S E Robertson,S Walker,H ZaragozaZaragoza&Microsoft Cambridge at TREC-11:Filtering track.Report at TREC-11,2002.&Microsoft Cambridge at TREC-11:Filtering track.Report at TREC-11,2002.16 T Zhang.Regularized winnow methods.In Advances in Neural Information Processing Systems 13,pages 703-7

36、09,2001.16 T Zhang.Regularized winnow methods.In Advances in Neural Information Processing Systems 13,pages 703-709,2001.17 17 陈彩云,李治国陈彩云,李治国陈彩云,李治国陈彩云,李治国.一种基于一种基于一种基于一种基于SVDSVD和和和和RoughRough集的信息过滤方法集的信息过滤方法集的信息过滤方法集的信息过滤方法.计算机工程与应用计算机工程与应用计算机工程与应用计算机工程与应用,2003,2003年年年年18 Badrul M.Sarwar,George Kar

37、ypis,Joseph A.Konstan,John T.Riedl.(2000).Application of Dimensionality Reduction in 18 Badrul M.Sarwar,George Karypis,Joseph A.Konstan,John T.Riedl.(2000).Application of Dimensionality Reduction in Recommender System-A Case StudyRecommender System-A Case Study,ACM WebKDD 2000 Web Mining for E-Comme

38、rce WorkshopACM WebKDD 2000 Web Mining for E-Commerce Workshop,2000200019 D.A.Hull,J.O.Pedersen,and H.19 D.A.Hull,J.O.Pedersen,and H.ShutzeShutze.Method combination for document filtering,In Proceedings of SIGIR,pages 279-.Method combination for document filtering,In Proceedings of SIGIR,pages 279-2

39、98,1996.298,1996.20 F.20 F.SebastianiSebastiani.Machine learning in automated text categorization:a survey.Technical report .Machine learning in automated text categorization:a survey.Technical report IstitutoIstituto didi ElaborazioneElaborazione dellInformazionedellInformazione,C.N.R.,Pisa,Italy,1999.,C.N.R.,Pisa,Italy,1999.21 21 张刚等,面向信息内容安全的文本过滤系统研究,哈尔滨工业大学信息检索研究室论文集,第一卷,张刚等,面向信息内容安全的文本过滤系统研究,哈尔滨工业大学信息检索研究室论文集,第一卷,张刚等,面向信息内容安全的文本过滤系统研究,哈尔滨工业大学信息检索研究室论文集,第一卷,张刚等,面向信息内容安全的文本过滤系统研究,哈尔滨工业大学信息检索研究室论文集,第一卷,2003 2003

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁