《网络信息采集与利用.ppt》由会员分享,可在线阅读,更多相关《网络信息采集与利用.ppt(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、网络信息采集与利用 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望本课程共九章第1章 网络信息资源概论 第2章 网络信息处理方式及关键技术 第3章 搜索引擎及其使用 第4章 其他网络信息资源及其使用 第5章 联机检索技术及其应用 第6章 网络学术数据库信息采集 第7章 非万维网网络信息的采集 第8章 网络信息编辑 第9章 网络竞争情报采集与分析 2第1章 网络信息资源概论第一节 互联网概况第二节 网络信息资源概述第三节 网络信息资源的类型第四节 网络信息资源检索第
2、五节 网络信息采集与利用的未来趋势 3第一节 互联网概况一、互联网在中国的发展二、互联网术语1.通信协议2.IP地址3.子网和子网掩码4.域名系统5.中文域名6.网络实名7.局域网及广域网8.Internet服务器4第一节 互联网概况三、Internet提供的服务1.电子邮件2.电子公告板3.远程登录4.网络新闻5.文件传输协议6.博客7.其他服务5第一节 互联网概况四、计算机网络安全1.防火墙技术2.密码技术6第二节 网络信息资源概述一、网络信息资源的含义二、网络信息资源的特点存储数字化表现形式多样化以网络为传输媒介传播方式的动态性信息源复杂7第三节 网络信息资源的类型一、按所对应的非网络信
3、息资源分类二、按人类信息交流的方式分类三、按信息存取方式分类四、按网络信息资源的层次分类8第四节 网络信息资源检索一、网络信息资源检索的方法浏览信息借助网络检索工具利用搜索引擎在线数据库查询9第四节 网络信息资源检索二、网络信息资源检索的技巧主题指南与搜索引擎相结合缩小检索范围扩大检索范围使用组合搜索关键词强制搜索模糊搜索先思考先分析10第四节 网络信息资源检索三、影响网络信息资源检索的因素信息资源的质量检索软件用户水平四、提高网络信息资源检索效率的方法培养“信息素养”不断探索、积累经验、提高信息获取能力11第五节 网络信息采集与利用的未来趋势一、网络检索自动化技术的发展二、多媒体技术的应用三
4、、多语种检索四、检索工具智能化12第2章 网络信息处理方式及关键技术第一节 文献标引理论第二节 检索语言第三节 计算机信息检索第四节 元数据技术第五节 中文自动分词处理技术第六节 文本自动处理技术第七节 网络信息挖掘13第一节 文献标引理论一、文献标引的概念 1.文献标引的目的及意义 2.文献标引的方式 3.主题标引与分类标引的异同 14第一节 文献标引理论二、文献分类标引原则 1.学科属性原则 2.专指性原 3.实用性原 4.系统性原则 5.逻辑性原则 6.一致性原则 7.“其他”类原则 8.入上位类或依论述重点归类原则 9.新学科、新主题文献分类原则15第一节 文献标引理论三、文献主题标引
5、 1.特征 2.类型四、网络信息资源的分类标引16第二节 检索语言一、检索语言的概念二、检索语言的分类 1.分类语言 2.主题语言17第三节 计算机信息检索一、计算机信息检索概述 1.计算机信息检索概念 2.计算机信息检索的特点 3.计算机信息检索系统的构成 4.计算机信息检索系统的分类 18第三节 计算机信息检索二、计算机信息检索技术 1.布尔逻辑检索 2.截词检索 3.字段检索 4.位置算符检索 5.全文检索19第四节 元数据技术一、元数据的概念二、元数据的应用 1.元数据的应用目的 2.元数据的应用领域 3.Metadata格式的应用现状20第五节 中文自动分词处理技术一、中文自动分词概
6、述二、中文文献的索引方法 1.基于字符串匹配的分词方法 2.基于统计的分词方法 3.基于理解的分词方法三、简单的匹配方法 1.正向减字最大匹配法(MM)2.逆向减字最大匹配法(RMM)3.正/逆向结合的方法21第五节 中文自动分词处理技术四、典型自动分词系统介绍 1.早期的自动分词系统 2.清华大学SEGTAG系统 3.复旦分词系统22第六节 文本自动处理技术一、文本自动处理技术概述二、文本自动分类 1.数据准备 2.训练 3.运行三、文本自动聚类四、自动文摘23第七节 网络信息挖掘一、网络信息挖掘中的关键技术 1.目标样本的特征提取 2.中文分词处理 3.获取网络中的动态信息二、网络信息挖掘
7、技术流程的实现三、网络信息挖掘技术在搜索引擎中的应用24第3章 搜索引擎及其使用第一节 搜索引擎概述第二节 搜索技术基础第三节 搜索引擎Google的使用第四节 百度搜索的使用第五节 特色搜索引擎25第一节 搜索引擎概述一、搜索引擎的历史二、搜索引擎的分类三、搜索引擎的工作原理四、搜索引擎的组成五、搜索引擎的性能指标26第一节 搜索引擎概述六、搜索引擎面临的挑战 1.网络信息量迅猛增加 2.网络信息的无序化 3.信息的有用性评价困难 4.网络信息日新月异的变化 5.带宽等其他因素27第一节 搜索引擎概述七、搜索引擎的未来发展 1.破解用户之意,信息抽取,优化排序 2.基于视觉网页块分析 3.网
8、页库内容分类 4.潜在相关性 5.网页结构化信息抽取类技术 6.自然语言处理,简单的语意语法分析 7.重复识别 28第一节 搜索引擎概述 8.行业优化 9.相关搜索 10.采集更多的数据 11.跟踪互联网变化,进行细节上的优化29第一节 搜索引擎概述八、常用搜索引擎简介 1.英文搜索引擎 2.中文搜索引擎30第二节 搜索技术基础一、基本的搜索技巧 1.简单信息查找 2.使用双引号进行精确查找 3.使用加减号限定查找 4.有针对性地选用搜索引擎 5.细化查询 6.根据需求选择查询方法31第二节 搜索技术基础 7.注意细节 8.利用选项界定查询 9.尽可能将搜索范围限定在特定的领域里 10.使用更
9、特定的词汇32第二节 搜索技术基础二、快速搜索技巧 1.搜索词组 2.选择词组 3.查找信息源33第三节 搜索引擎Google的使用一、Google简介二、Google的使用方法 1.首页介绍 2.基本搜索 3.辅助搜索 4.进阶搜索 5.其他语法 6.图片搜索34第三节 搜索引擎Google的使用 7.目录搜索 8.新闻组(Usenet)搜索 9.新闻搜索 10.其他功能35第四节 百度搜索的使用一、百度简介二、百度搜索的使用方法 1.基本语法 2.百度新闻搜索 3.百度MP3搜索 4.百度图片搜索 5.百度贴吧搜索 6.百度中文搜索风云榜 7.百度搜索工具36第五节 特色搜索引擎一、图片搜
10、索 1.中文图片搜索引擎 2.英文图片搜索引擎二、FTP搜索引擎三、新闻组搜索四、新闻搜索引擎五、MP3搜索引擎 1.中搜MP3搜索 2.搜刮网(SoGua)37第五节 特色搜索引擎六、Flash搜索引擎七、其他特色搜索引擎 1.字典搜索 2.地图搜索 3.域名搜索和IP搜索 4.寻人搜索 5.科技搜索引擎38第4章 其他网络信息资源及其利用第一节 网页浏览器及使用技巧第二节 网络目录的利用第三节 虚拟图书馆资源的挖掘39第一节 网页浏览器及使用技巧一、Internet Explore 8 浏览器 1.IE8.0的安装 2.初次启动 3.IE8.0新增的功能二、其他浏览器 1.Mozilla
11、Firefox 浏览器 2.Opera 浏览器 40第一节 网页浏览器及使用技巧 3.Safari 浏览器 4.可在线翻译的Fast Browser 浏览器 三、离线浏览器 1.Offline Explorer Pro 浏览器 2.Web Zip 浏览器 3.Web Reaper 浏览器41第二节 网络目录的利用一、网络目录概述 1.目录资源的收集和分类 2.网络目录结构 3.网络目录分类方法 4.网络目录与搜索引擎的比较42第二节 网络目录的利用二、Open Directory ProjectODP的由来分类43第二节 网络目录的利用三、其他优秀网络目录简介LookSmartGalaxyAb
12、outAskJeevesSinasohu44第二节 网络目录的利用四、专业目录的使用EEVLInternet精英搜索45第三节 虚拟图书馆资源的挖掘一、虚拟图书馆概述相关概念虚拟图书馆与数字图书馆的比较虚拟图书馆设计原理46第二节 网络目录的利用二、虚拟图书馆资源及其利用WWW虚拟图书馆列治文公共图书馆化学虚拟图书馆虚拟运输图书馆澳门虚拟图书馆数字虚拟图书馆清华大学虚拟图书馆大英图书馆47第5章 联机检索技术及其应用第一节 联机检索概述第二节 主要国际联机检索简介48第一节 联机检索概述一、联机检索概况二、联机检索的特点三、联机检索的服务范围49第二节 主要国际联机检索简介一、DIALOG系统
13、二、Questel-Orbit三、ESA-IRS四、STN系统五、OCLC First Search50第6章 网络学术数据库信息采集第一节 中国高等教育文献保障系统第二节 万方数据资源系统第三节 中文全文型期刊数据库中国知网第四节 中文图书数据库第五节 综合性数据库EI Village第六节 全文电子期刊51第一节 中国高等教育文献保障系统一、CALIS的概况二、CALIS的主要服务内容CALIS联合目录公共检索系统联机编目集团采购文献传递网52第二节 万方数据资源系统一、万方数据资源系统概况二、万方数据资源的内容期刊论文学位论文会议论文专利成果法规标准企业信息西文期刊论文西文会议论文科技动
14、态53第三节 中文全文型期刊数据库中国知网一、中国知网简介二、中国知识资源总库系列元数据库系列专业知识仓库系列知识元数据仓库其他54第四节 中文图书数据库一、超星数字图书馆二、书生之家主页板块介绍检索图书阅读器55第五节 综合性数据库EI Village一、简介二、数据库介绍Compendex数据库Inspec数据库NTIS数据库56第五节 综合性数据库EI Village三、检索方法快速检索专家检索词典检索检索历史四、辅助索引57第六节 全文电子期刊一、Elsevier Science Direct On Site数据库简介检索指南二、IEEE/IEE Electronic Library简
15、介检索方法三、Springer Link简介检索途径58第七章 非万维网网络信息的采集第一节 FTP第二节 邮件列表第三节 Usenet第四节 Telnet和BBS59第一节 FTP一、FTP简介FTP服务器和客户端FTP登录二、FTP搜索引擎60第一节 FTP三、FTP信息资源的获取CuteFTPFTP信息资源的解读技巧四、知名FTP资源61第二节 邮件列表一、邮件列表简介二、邮件列表的使用方法和技巧深沪股市行情综合性中文邮件列表HAMWinNews62第三节 UsenetUsenet简介特点63第四节 Telnet和BBS一、Telnet二、BBS64第八章 网络信息编辑第一节 信息筛选第
16、二节 网络信息制作65第一节 信息筛选一、网络信息的价值判断真实性权威性时效性趣味性实用性二、与网络信息收集有关的知识产权问题66第一节 信息筛选二、与网络信息收集有关的知识产权问题网络在知识产权方面存在的问题67第二节 网络信息制作一、单篇稿件的加工稿件的修改稿件的改正稿件的增补稿件的提炼稿件的标题制作二、多篇稿件的整合三、网络信息的组织68第二节 网络信息制作二、多篇稿件的整合围绕稿件进行整合围绕事件进行整合围绕主题进行整合三、网络信息的组织69第二节 网络信息制作三、网络信息的组织高效导读恰当评价物尽其用70第九章 网络竞争情报采集与分析第一节 竞争情报的基本概念第二节 竞争情报的获取第三节 竞争情报的分析方法71第一节 竞争情报的基本概念竞争情报功能72第二节 竞争情报的获取一、竞争情报的获取策略1.竞争情报工作的一般步骤2.明确“需”与“求”3.连续性和系统性原则确定检索语言73第二节 竞争情报的获取二、信息源及竞争对手情报的获取方法公开资料电子信息源人际关系网会议信息74第三节 竞争情报的分析方法一、SWOT分析法二、专利分析三、财务报表分析四、竞争对手跟踪75