《2022年网络信息管理 .pdf》由会员分享,可在线阅读,更多相关《2022年网络信息管理 .pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、网络信息管理第一章1、网络信息资源的开发层次答:网络信息资源的开发可分为两个层次:基础层次的开发应用方面的开发基于网络信息资源开发的内涵可分为可得性开发: 建网与联网信息资源建设(网上信息资源从无到有、从有到优化的开发) 可用性开发 : 主要包括免费信息资源深度与广度的挖掘、镜像资源的开发、收费资源的代理服务、局域网和区域网资源的组织和服务等。 高水平利用状态的开发: 专题性开发利用预测性开发利用创新性开发利用2、网络信息资源开发利用的主要方式答:建立信息导航库:概念导航和结构导航是一种利用最多、最简单、最直接的网络信息资源开发模式主要功能: a 帮助浏览者进行整体文档结构定位B 根据浏览者的
2、浏览行为给予浏览导航网络信息的重组信息重构网络专业信息指南系统开发专业信息资源指引库的开发基于元搜索引擎的开发网络信息资源的内容挖掘虚拟数据库开发主题网关的开发网络信息资源的优化配置网络信息资源的配置类型:时间上矢量配置空间上矢量配置品种类型配置第二章1、内容分析法的概念答: 1. 顾名思义,内容分析法是对文献内容进行客观、系统、量化分析的一种科学研究方法。2. 内涵特征:研究对象的特征,是具有明确特性的传播内容。分析方法的特征,是客观、系统和定量。结果表述的特征,是描述性的。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师
3、精心整理 - - - - - - - 第 1 页,共 8 页 - - - - - - - - - 2、内容分析法的方式答:解读式内容分析法实验式内容分析法计算机辅助内容分析法3、什么是解读式内容分析法答:解读式内容分析法是一种通过精读、理解并阐释文本内容来传达作者意图的方法,适用于以描述事实为目的的个案研究。4、文本分析含义:指忽略网页上的多媒体信息,只考虑文字本身的网络内容分析方法。文本分析是传统内容法在网络上的具体应用,有词频分析和篇幅分析。5、文本分析软件的功能答:文本输入与管理分析词典、分类方案及编码输出6、网络内容分析的基本框架(图见书190)答:确定目标选择样本数据收集选择分析要素
4、建立分析类目编码数据统计数据表达与解释7、网络内容分析的优势与局限性答: 优势 : 定性与定量相结合数据库的发展提高了内容分析的效率网络使得内容分析的层次得到扩展局限性: 网络信息质量问题选择样本问题分析要素和分析类目问题研究方法问题信度和效度问题内容分析不确定的属性(随机性、模糊性、非唯一性、局限性)8、网络内容分析法的两层含义: 对网络内容分析基于网络技术和网络环境来研究内容分析法名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 8 页 - - - - - - - -
5、- 第三章1、网络信息过滤中间的基本原理答:用户对某种信息的选择需求是信息过滤的前提用户的信息需求以计算机能够识别的形式揭示出来,就是用户需求模板用户需求模板的构建、信息的揭示、匹配算法和反馈机制是最为关键的部分2、信息过滤中的一般模型答:匹配算法与用户需求模板的描述方法、信息的揭示方法是相互联系的,常用的匹配模型有 布尔模型、向量空间模型、概率模型、基于知识的表示模型、混合模型等3、信息过滤和信息检索的关系答:相同: 目的相同 (都是根据用户的信息需求从信息集中获取信息,目的是要满足用户的信息需求)原理基本相同效率的评价基本相同(过滤正确率、过滤错误率、滤准率、滤全率)不同:用户:网络信息检
6、索一般是对一个用户;网络信息过滤争对一个或一组用户信息需求 :网络信息检索用户一次性的或短期的信息需求,信息需求的描述为检索表达式;网络信息过滤用户长期的信息需求,信息需求的描述为用户需求模板信息集合 :网络信息检索必须对信息集进行标引,结果存储在数据库中;网络信息过滤对信息集不作预处理,过滤时自动分析对象 :网络信息检索的对象是相对静态的结构化的数据;网络信息过滤过滤的是动态的半结构化或非结构化的数据动态信息集用户信息需求揭示信息用户需求模板匹配算法过滤结果反馈机制名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理
7、- - - - - - - 第 3 页,共 8 页 - - - - - - - - - 结果: 网络信息检索输出的是相关的信息,带有回滞性;网络信息过滤不仅输出需要的信息,更着重于剔除不需要的信息,具有即时性过滤正确率 =被正确过滤的信息/ 应该过滤的信息*100% 过滤错误率 =被错误过滤的信息/ 不应该过滤的信息*100% 滤准率 =过滤得到的用户需要的信息/ 过滤得到的信息*100% 滤全率 =过滤得到的用户需要的信息/ 用户需要的所有信息*100% 4 网络信息过滤的作用: 减轻认知压力的减压阀开展个性化信息服务的推动者保持网络顺畅的把关人清楚不良信息的净化器5 网络信息管理的主要方法
8、:分级法:包括,分级体系、PICS 规范、 PICS 技术规范介绍(详细见书)URL地址列表法(详细见书) 动态文本分析法第四章1、电子文件的微观管理指文件和档案管理人员从以电子文件为客体对象,运用一定的技术,方法对其加以组织和控制,形成有序,系统的电子文件信息资源,维护电子文件信息的真实性、完整性、有效性,并向社会提供利用服务2、电子文件的宏观管理指文件和档案的行政与业务管理部门以电子文件管理为客体对象,运用法律法规、制度办法、 规划标准等对电子文件管理工作的组织和人员加以指导控制,并提供相应技术,条件支持, 以形成有效运作机制、管理机制, 使电子文件微观管理工作规范制度化,确保电子文件完整
9、保存的历史责任得以实现。3、电子文件管理模式A、分散保管模式 1 、指政府机构以及各种社会组织产生的电子文件不集中在各级档案馆保存,而采用分布式管理方法, 将其保存在产生这些文件的机构内,由档案馆对电子文件信息及以控制,并对其保护管理加以指导和帮助 2、理论基础是:后保管模式(案例:澳大利亚档案馆)B、集中保管模式指将具有永久价值的电子文件传送到档案馆集中保存,即对电子文件实体和信息进行双重控制第五章1、数据挖掘:是从大量的、不完全的、模糊的、随机的数据中提取人们感兴趣的知识的过名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名
10、师精心整理 - - - - - - - 第 4 页,共 8 页 - - - - - - - - - 程。2、网络数据挖掘: (1)网络数据挖掘有多种称法,如:网络信息挖掘、Web 数据挖掘和网络知识发现等;(2) 网络数据挖掘是数据挖掘技术在网络信息处理中的应用,是指从与网络相关的资源和行为中抽取感兴趣的、有用的模式和隐含的信息,是从 Web网站的数据中发掘关系和规则。(3)其挖掘对象是大量、异质、分布的Web 文档,可以对数据库、Web服务器上的日志、用户信息等数据开展挖掘工作。3、数据挖掘步骤答: 1、准备数据2、定义问题3、选择方法4、挖掘数据5、选择模式6、评估模式7、更新知识8、运用
11、知识4、数据挖掘的方法答: 1、统计分析方法2、遗传算法3、粗集方法4、决策树方法5、神经网络方法6、聚类法7、可视化技术8、分类法聚类法:1、 定义:聚类算法是通过对变量的比较,把具有相似特征的数据归于一类。2、 聚类与分类不同:分类的类别是按应用的要求事先给定的,根据表示的事物特征的数据可以识别其类别;而聚类的类型不是指定的,而是分析数据的结果3、 聚类大致上可以分为:分类聚类、概念聚类5、网络数据挖掘方法:(1)网络信息挖掘:Web文本挖掘 、多媒体数据的挖掘(2)网络信息结构的数据挖掘(3)网络使用记录挖掘Web 文本挖掘:(1)文本挖掘是从非结构化的文本中发现潜在的知识(2)文本挖掘
12、处理的对象主要是大量的、无结构的文本信息(3) Web文本挖掘可以对Web 上大量文档的集合的内容进行总结、分类、聚类、关联分析,以及利用Web 文档进行趋势预测(4)Web 文本挖掘面临的首要问题 是如何在计算机中合理的表示文本(5)文本挖掘的相关技术:a 文本分类; b 文本聚类; c 自动摘要; d 文本可视化web 网页链接挖掘意义: (1)Web 网页链接分析是网络信息计量学的一项重要的内容;(2)分析和评价网页的质量;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页
13、,共 8 页 - - - - - - - - - (3)指导网络资源的组织建设;(4)应用于网络资源检索和利用(5)网页链接分析有利于分析和掌握学科发展状况,如:学科的独立性、吸收能力、渗透性、地位、发展动态和趋势等;(6)有利于开发和应用智能超文本链接第六章1、网络信息集成的9 种方式:( 1)基于虚拟数据库的网络信息集成(2)基于 XML 的网络信息集成(3)基于 Web 数据仓库的网络信息集成(4)基于智能代理的网络信息数据的集成(5)基于 Web 服务的网络信息集成(6)基于本体的网络信息集成(7)基于开放链接的网络信息集成(8)基于跨库检索的网络信息集成(9)基于信息门户的网络信息集
14、成2、9 种方式中实体的是:基于 Web数据仓库的网络信息集成、虚拟的是: 基于虚拟数据库的网络信息集成、基于XML 的网络信息集成、基于本体的网络信息集成、基于信息门户的网络信息集成3、9 种方式的优缺点( 1)基于虚拟数据库的网络信息集成( 2)基于XML 的网络信息集成优点:(1)以解决集成中的分布与异构问题(2)以对非结构化信息进行XML标记定义,从而实现非结构化信息查询与存储的小粒度( 3)基于Web 数据仓库的网络信息集成优点1、更容易访问;2、平台独立无关性;3、低建设和管理成本( 4)基于智能代理的网络信息数据的集成优点1、可以减轻网络负载2、移动智能代理可以异地自主运行3、移
15、动智能代理具有很强的应变能力4、移动智能代理具有异构性( 5)基于Web 服务的网络信息集成名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 8 页 - - - - - - - - - ( 6)基于本体的网络信息集成优点1、本体提供了丰富的、预定义的词汇作为数据库稳定概念的接口,而且是独立于数据库模式的;2、由本体表示的知识对于所有的相关数据源之间的转化都是可理解的;3、本体支持一致的管理知识和识别不一致性的数据缺点: 1、缺乏一个成熟的开发和使用本体的方法学2、建立映射、
16、尤其是本体间的映射时,随意性比较大,并且映射关系多是一对一的3、很大程度上依赖于领域专家的帮助,一些工作很烦琐( 7)基于开放链接的网络信息集成( 8)基于跨库检索的网络信息集成( 9)基于信息门户的网络信息集成4、虚拟数据库的含义虚拟数据库(VDB ) ,是使外界的数据表现为一个特定的关系数据库系统的一个扩展5、什么是信息门户答:信息门户主要指根据一定的需求,采用一定的技术和标准,将某一领域的重要资源及其之间的关联集成到一个平台上,并提供相应的检索与服务。第七章1、信息资源存储的概念答:信息资源存储是指将经过加工处理后的信息资源,按照一定的规定记录在相应的信息载体上, 并将这些载体按照一定的
17、特征和内容性质组织成系统化的检索体系。信息存储是传播过程的终端,即把信息保存起来,而存储的信息可以作为下一轮信息源2、数字信息长期保存技术:(1)拷贝;(2)技术仿真;(3)迁移;(4)更新;( 5)再生性保护技术;(6)数字图形输入板3、信息资源长期保存技术的选择依据: (1)可行性(2)可持续性(3)可操作性(4)合理性4、信息存储类型: (1)人脑载体存储(2)语言载体存储(3)文字载体存储名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 8 页 - - - - -
18、- - - - (4)书刊载体存储(5)电信载体存储(6)计算机载体存储(7)新材料载体存储5、信息资源长期保存的主要内容:(1)保存数据信息流(2)保存数字格式与处理信息(3)保存数字信息处理环境(4)保存数字信息的内容检验、身份认证、版本演变、知识产权的管理机制、确保能可靠与合法的鉴别、使用被保护的数字信息(5)保存数字信息资源的知识组织体系和数字信息的组织利用环境(6)技术保存6、存储网格:指的是具有海量数据存储能力的信息网格,具体来说它是指运用网格技术包括虚拟化和开放标准,实现分布、 异构的存储共享和数据一体化,为各类用户提供统一的网格存储服务7 目前存储系统根据服务器类型分为:A 封闭系统的存储B 开放系统的存储:a 内嵌式存储b 外挂存储: 1、直连式存储2 网络化存储: 网络接入存储和存储区域网络8 存储虚拟化 :利用虚拟化技术将不同厂商的FC-SAN 、NAS 、IP-SAN 和 DAS这 4 类存储资源整合起来,形成一个可统一管理、监控和使用的公用存储池名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 8 页 - - - - - - - - -