《第03章 信息资源组织方法(陈庄)课件.ppt》由会员分享,可在线阅读,更多相关《第03章 信息资源组织方法(陈庄)课件.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)1陈庄陈庄 博士博士 教授教授2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)2内容提要 3.1信息资源组织概述 信息资源组织的内涵 信息资源组织的目的和要求 信息资源组织的过程3.2信息采集 信息源 信息采集途径 信息采集的方法3.3 信息资源组织的基本方法及途径 信息资源组织的基本方法 信息资源组织的途径 3.4 网络信息资源组织方法 网络信息资源组织的新特点 网络信息资源组织方法3.5 信息资源组织案例 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)33.1. 1 信息资源组织的内涵v
2、什么是信息资源组织?,又称信息资源整序,是利用一定的科学规则和方法,通过对信息资源外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息资源的有效获取和利用,以及信息的有效流通和组合。目的:把无序信息流转化为有序信息流,形成更高级的信息产品,以满足人们的特定需要。v是信息检索与咨询的基础 ;v是开展用户服务的有力保证 。2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)43.1. 2 信息资源组织的目的和要求v目的:(1) 减少社会信息流的混乱程度(2) 提高信息产品的质量和价值。(3) 建立信息产品与用户的联系。(4) 节省社会信息活动的总成本。
3、 (5) 组织各种类型的信息资源检索工具。 v基本要求:(1) 信息内容有序化。 (2) 信息流向明确化 (3) 信息流速适度化。 (4) 信息数量精约化。 (5) 信息质量最优化。2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)53.1. 3 信息资源组织过程v从狭义上理解单纯指信息整序,即利用一定的科学方法,对信息外在特征和内容特征进行分析、选择、标引、处理,将无序的社会信息流转换为有序的社会信息流的过程。 v从广义上理解2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)63.2.1 信息源(1/6) 1、什么是信息采集信息采集是指根据特定目的和要求将分散
4、蕴涵在不同信息源的有关信息采掘和积聚起来的过程。 2、什么是信息源信息源是人们获取信息的源头。1 1、个人信息源、个人信息源2 2、实物信息源、实物信息源3 3、文献信息源、文献信息源4 4、数据库信息源、数据库信息源5 5、组织机构信息源、组织机构信息源包括包括2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)73.2.1 信息源(2/6) 1、个人信息源概念v也称口头信息源,即通过人与人间的口头语言交流来获取信息的也称口头信息源,即通过人与人间的口头语言交流来获取信息的方式方式。 v人既是信息的凝聚点,也是信息的发射源。人既是信息的凝聚点,也是信息的发射源。特点 v(1)(
5、1)及时性及时性v(2)(2)新颖性新颖性 v(3)(3)强化感知性强化感知性v(4)(4)主观随意性主观随意性 v(5)(5)瞬时性瞬时性2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)83.2.1 信息源(3/6) 2、实物信息源概念v实物信息源主要是指各种无机物实物信息源主要是指各种无机物( (如水、空气、土壤、岩石、矿如水、空气、土壤、岩石、矿石等石等) )样品,有机物样品,有机物( (如动植物等如动植物等) )化石或标本,文物和人类劳动化石或标本,文物和人类劳动成果的样本,各类产品及服务市场,实验室以及其他有可能出现成果的样本,各类产品及服务市场,实验室以及其他有可
6、能出现新的信息新的信息“火花火花”的场所。的场所。特点 v(1)(1)直观性直观性 v(2)(2)真实性真实性 v(3)(3)隐蔽性隐蔽性 (潜在在实物中)(潜在在实物中)v(4)(4)零散性零散性 (时空分布广)(时空分布广)2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)93.2.1 信息源(4/6) 3、文献信息源概念v指用一定的记录手段将系统化的信息内容储存在纸张、胶片、磁指用一定的记录手段将系统化的信息内容储存在纸张、胶片、磁带、磁盘和光盘等物质载体上而形成的一类信息源。带、磁盘和光盘等物质载体上而形成的一类信息源。 v如:图书、期刊杂志、影像资料、微缩胶卷如:图书
7、、期刊杂志、影像资料、微缩胶卷特点 v(1)(1)系统性系统性v(2)(2)稳定性稳定性 v(3)(3)易用性易用性v(4)(4)可控性可控性 (控制:数量、质量、流量)(控制:数量、质量、流量)v(5)(5)时滞性时滞性 (如:论文发表时间、图书的出版周期)(如:论文发表时间、图书的出版周期)2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)103.2.1 信息源(5/6) 4、数据库信息源概念v以数据库方式提供信息服务的一类信息源。以数据库方式提供信息服务的一类信息源。v把大量的数据组织成数据库,一方面提高了用户的信息检索效率,把大量的数据组织成数据库,一方面提高了用户的信
8、息检索效率,另一方面也有利于实现信息资源共享。另一方面也有利于实现信息资源共享。 v如:文字数据库、数值数据库、声像数据库和多媒体数据库等。如:文字数据库、数值数据库、声像数据库和多媒体数据库等。特点 v(1)(1)多用性(为用户提供尽可能多的检索途径多用性(为用户提供尽可能多的检索途径 )v(2)(2)动态管理性动态管理性 (便于扩充修改,更新速度快(便于扩充修改,更新速度快 )v(3)(3)技术依赖性技术依赖性 (依赖于计算机的运算能力和存储能力(依赖于计算机的运算能力和存储能力 )2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)113.2.1 信息源(6/6) 5、组织
9、机构信息源概念v各级各类组织机构主要是通过内外信息交换来发挥其控制功能,各级各类组织机构主要是通过内外信息交换来发挥其控制功能,实现组织目标的一类信息源。实现组织目标的一类信息源。v如:重庆市统计局信息、重庆市质监局信息。如:重庆市统计局信息、重庆市质监局信息。特点 v(1)(1)权威性权威性 (如:研究开发信息、生产经营信息、质量监督管理(如:研究开发信息、生产经营信息、质量监督管理信息信息 )v(2)(2)垄断性垄断性 (房管局的房屋拆迁信息、物价局的物价变更信息(房管局的房屋拆迁信息、物价局的物价变更信息 )2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)123.2.2
10、 信息采集途径(1/2) 1 1、内部途径、内部途径(1)管理监督部门 (人财物、产供销等管理部门)(2)研究开发部门 (技术中心、研究院所)(3)市场营销部门 (市场部、销售部)(4)“葡萄藤”渠道 (小道消息的非正规组织信息流;决策者收集反馈意见)(5)内部信息网络2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)133.2.2 信息采集途径(2/2) 2 2、外部途径、外部途径(1)大众传播媒介 (各种传媒体:广播、电视、报纸、杂志等)(2)政府机关 (档案:工商企业注册登记通告、上市公司业绩报告、专利、标准等;政府出版物:研究报告、统计资料、各类白皮书等)(3)社团组织
11、 (学会、协会:内部通讯、专业简报 )(4)各种会议 (会议:研讨会、洽谈会、展览会、展销会、交易会、现场会、发布会、演示会 )(5)个人关系 (广交朋友:接触、聚会闲聊 )(6)协作伙伴 (供应链为纽带,在“双赢”原则下连成一体) (7)用户和消费者 (用户:需求信息;消费者:反馈信息 )(8)外部信息网络Internet2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)143.2.3 信息采集的方法(1/3) 信息类型采集途径动态信息静态信息公开信息问卷调查法预订采购法参观考察法信息检索法专家咨询法日常积累法非公开信息访问交谈法交换索要法技术截获法委托收买法敲诈利诱法抢劫窃
12、取法以下重点介绍两种以下重点介绍两种2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)153.2.3 信息采集的方法(2/3) 1 1、问卷调查法、问卷调查法(1)问卷设计v问卷格式应清晰,长度要适中;v调查项目的安排要合理,并注意问答形式;v提问时的语言应通俗易懂,明确具体。(2)选取样本v1)简单随机抽样:适合于总体中个体单位差异不大情况;v2)系统抽样:适合于总体中个体单位差异不大情况; v3)分层抽样(类型特征分层,选代表性样本)。适用于总体数量较多,且内部差异较大的调查对象。v4)整群抽样(集体抽样:先将总体按一定标准分成许多群或集体,然后随机抽取若干群或集体作为样本
13、实施逐个调查)。v5)多段类集抽样。 (3)实施调查2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)163.2.3 信息采集的方法(3/3) 2 2、访问交谈法、访问交谈法(1)准备阶段v1) 选择访谈对象:一是选择关键人物;二是利用人际关系网络。v2)拟定访谈提纲:访谈目的、中心议题和提问方式。v3)提前与被采访者取得联系:确认访谈时间、地点、人物等。 v4)携带必要证件、资料、工具:以便在需要时展示、记录。(2)实施阶段接近被采访者、提出询问问题、引导和追询、访谈结束等几个环节。v基本访谈技巧:基本访谈技巧: 自然接近(共同活动)、求同接近(寻求共同点)、友好接近(从关怀
14、、帮助来联络感情)、正面接近(即开门见山)、隐蔽接近(伪装的身份、伪装的目的接近对方)。 创造一个融洽的沟通氛围 ;将疑问句变为陈述句;提醒、引导话题;以怀疑、惊奇、感叹的短句,使问题更具体、更准确;在准确记录回答的词语部分之外,在页边写下自己的观察和理解。(3)整理阶段2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)173.3.1 信息资源组织的基本方法(1/3) 1 1、形式特征组织法、形式特征组织法概念v形式特征组织法是根据信息的形式特征,使用一套形式化的符号系统,按照一定的规则组织信息的方法。常见的形式特征组织法包括如下几种:v(1)字顺组织法:按照揭示信息概念、信息
15、记录和信息实体有关特征所使用的语词符号的音序或形序来组织排列信息的方法。 v(2)号码组织法 :按照每件信息被赋予的号码次序或大小顺序排列的方法。 v(3)时空组织法:按照信息概念、信息记录和信息实体产生、存在的时间、空间特征或其内容所涉及的时间、空间特征来组织排列信息的方法。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)183.3.1 信息资源组织的基本方法(2/3) 2 2、内容特征组织法、内容特征组织法概念v根据信息的内容特征,使用一套含有语义的符号系统来组织信息,就是内容特征组织法。 常见的内容特征组织法包括两种:v(1)分类组织法:依照类别特征组织排列信息概念、
16、信息记录和信息实体的方法。 v(2)主题组织法 :按照信息概念、信息记录和信息实体的主题特征来组织排列信息的方法。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)193.3.1 信息资源组织的基本方法(3/3) 3 3、信息效用组织法、信息效用组织法概念v信息效用组织法是根据信息的实用价值来组织信息的方法, 它能够反映和满足用户的信息需求,在实际生活中应用极为广泛。 主要包括如下几种:v(1)权值组织法:赋予不同信息以不同的权重值,然后通过复杂的计算,以权值大小为依据组织信息的方法。v(2)特色组织法 :根据某类用户、某一用户或用户某一方面的特殊需要组织信息的方法,如旅游信
17、息等。 v(3)重要性递减法:重要性递减法是依据信息的重要程度序化信息,如报纸版面的设计等。2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)203.3.2 信息资源组织的途径(1/8) 1 1、信息选择、信息选择概念v从信息管理者的角度看,信息选择就是根据用户的需要,从社会信息流中把符合既定标准的一部分挑选出来的活动,是信息内容、传递时机、获取方式等信息流要素与用户需要相匹配的过程。 (1)信息选择的标准: 相关性 可靠性 先进性 适用性 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)213.3.2 信息资源组织的途径(2/8) 1 1、信息选择、信息选择
18、 (2)信息选择的方法: 比较法比较就是对照事物,以揭示它们的共同点和差异点。运用比较法,首先应找出事物可比的共同基础,即比较对象的可比事项。信息的可比事项包括时间、空间、来源、形式等等。 分析法通过对信息内容的分析判断其正确与否、质量高低、价值大小等。 核查法通过对有关信息所涉及的问题进行审核查对来优化信息的质量。 。 引用摘录法 引用表明了各信息单元之间的相互关系,一般来说,被引用次数较多或被本学科专业权威出版物引用过的信息质量较高。 专家评估法对于某些内容专深且又不易找到佐证材料的信息,可以请有关专家学者运用指标评分法、德尔斐(Delphi)法、技术经济评估法等方法进行评价,以估测其水平
19、价值,判断其可靠性、先进性和适用性 。2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)223.3.2 信息资源组织的途径(3/8) 2 2、信息标识、信息标识 (1)数据项的确定v数据项是描述信息外表特征或内容性质,如题名、作者、出版、主题、学科、号码等的各个著录事项,也是构成数据库记录的最小单位和基础。 v选取数据项一般应遵循下述原则 完整性原则。 标准化原则。 方便性原则。 低冗余原则。 灵活性原则。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)233.3.2 信息资源组织的途径(4/8) 2 2、信息标识、信息标识 (2)信息外表特征的加工v对于文
20、献型信息 无论是印刷载体,还是缩微、声像、机读载体,国内外均有许多信息加工条例和标准对各类数据项的选取和描述分别做了规定和说明,只不过由于载体的差异而要对其载体形态特征作出特别描述。 v对于非文献型信息(如口头信息和实物信息等,有两种加工方法)一种方法是将口头信息和实物信息转化为文献型信息,然后依规定格式进行加工; 另一种方法是直接描述事物的名称、外形、内容、性能、生产者及产生时间、地点等,按规定格式记录下来,形成数据库之类的信息产品。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)243.3.2 信息资源组织的途径(5/8) 2 2、信息标识、信息标识 (3)信息内容特征
21、的加工v信息内容特征的加工是指在对信息内容进行分析的基础上,根据一定规则给信息的内容属性予以标识,并作出描述的过程。这一过程通常称为信息标引。 v 分类标引根据既经选定的分类法,全面分析标引对象的特征,确定所属类目,并将标引对象的学科特征及有关信息,用分类法中规定的符号代码揭示出来。 较好地体现信息内容的学科系统性 ,从而满足了用户按学科专业进行信息检索的需要。不熟悉分类体系的人不易使用,且不能适时反映新兴学科。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)253.3.2 信息资源组织的途径(6/8) 2 2、信息标识、信息标识 (3)信息内容特征的加工v 主题标引主题标
22、引是按信息内容的主题名称来系统揭示和组织信息的方法。可以把有关同一主题的信息集中在一起,并将其按字顺排列起来。 主题标引的依据是主题法。主题法是一种以规范化或未经规范的自然语言作为信息主题标识的方法。按照选词原则、组配方式、规范措施和编制方法,主题法可分为、和。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)263.3.2 信息资源组织的途径(7/8) 3 3、信息重组、信息重组概念v根据用户需要将分散的信息汇集起来进行深层次加工处理,提取有关信息并适当改编和重新组合,形成各种精约化的优质信息产品。 (1) 汇编法v汇编是选取原始信息中的篇章、事实或数据等进行有机排列而形成
23、的,如剪报资料、文献选编、年鉴名录、数据手册、音像剪辑等。(2) 摘要法v摘要法是在信息加工过程中对原始信息的主要内容进行简明扼要地摘录,以便更全面、更深入地揭示原始信息的方法。 (3) 综述法 v综述是对某一课题某一时期内的大量有关资料进行分析、归纳、综合而成的具有高度浓缩性、简明性和研究性的信息产品。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)273.3.2 信息资源组织的途径(8/8) 4 4、信息存储、信息存储(1)文件系统存储v从信息科学的角度,将文件分为两类:(记录没有结构)、(记录有一定的结构) 。v文件在介质上的存储方式称为文件的物理结构。文件的物理结构
24、有、和三种基本方式,表现形式有、和等。:1、程序与文件过于相关,缺少程序和数据的独立性;2、处理程序必须过多地关心文件存储的细节;3、文件中的数据有大量冗余,修改和并发控制困难。 (2) 数据库与数据仓库v数据库是指为了满足多个用户的多种应用需求,按一定的数据模型和数据结构在计算机系统中组织、存储,并能供用户使用的相互联系的数据集合。 v数据库的实现依赖于计算机的超高速运算能力和大容量存储能力。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)283.4.1 网络信息资源组织的新特点1 1、组织自动化、组织自动化v如自动分类、自动标引、自动编制分类表、词表以及目录、索引、文摘
25、编制和管理的自动化等。2. 2. 方法多样化方法多样化v如何对非结构化信息进行加工和组织,如何揭示和描述其内容特征以及如何实现非文本信息数据库规模生产和低成本化等,已对以往的做法提出挑战。3. 3. 方法透明化方法透明化v在网络环境下,用户的成分逐渐多样化、复杂化,这要求信息资源组织方法透明化和易用化。 4. 4. 组织标准化组织标准化 v信息网络是对信息资源进行存储、加工和利用的协作系统,系统间的交流及网络资源的共享要求各方面的整体配合。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)293.4.2 网络信息资源组织方法(1/3) 1 1、网络一次信息资源的组织方式、网络
26、一次信息资源的组织方式v(1)自由文本方式简单方便,易于管理。随着信息量增多,以文本为单位共享和传输会使网络负载会越来越大;对结构化信息的组织和管理显得软弱无力;文本本身也需要作为对象进行管理。v(2)数据库方式对大量的结构化数据处理效率很高;数据的最小存储单位是字段,降低了网络传输负载。对非结构化信息的处理困难较大;缺乏直观性和人机交互性。v(3)超媒体方式以非线性的方式组织信息,符合人们思维联想与跳跃的习惯;具有良好的包容性和可扩充性;方便描述和建立各种媒体之间的语义联系,完全超越了媒体类型对信息组织与检索的限制。采用浏览的方式进行搜寻,当超媒体网络过于庞大时,很难迅速而准确地定位于真正需
27、要的信息结点上,容易造成迷航现象。2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)303.4.2 网络信息资源组织方法(2/3) 2 2、网络二次信息资源的组织方式、网络二次信息资源的组织方式v(1)搜索引擎方式 速度快,有较高的检全率。在逻辑上序化和优化网络信息资源,为充分开发利用这种资源提供了前提条件和可能。 搜索引擎中将元数据以数据库的方式进行组织,有些大型数据库,为了提高检索速度,还采用了多级索引的结构。 检准率低。 不能满足不同用户的个性需求 。 网站网页随时都有被删除、更改的可能,搜索引擎应及时将网页的变化反映到索引中,否则就会变成错误的链接。v(2) 数字图书馆
28、方式 信息存储的分布式。 信息组织的非线性。 信息组织结构的特殊性。 数字图书馆在一定程度上能满足公众对网络信息资源的需求,但不能满足不同用户的个性需求。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)313.4.2 网络信息资源组织方法(3/3) 1 1、网络二次信息资源的组织方式、网络二次信息资源的组织方式v(3) 虚拟图书馆组织方式 专业性或专题性。 用人工关键词标引法。 采用自动或人工分类方法。 采用数据库方法。 采用超级链接。 虚拟图书馆对网页、网站的收集和维护大都是采用人工手段,这种方法的效率较低。v(4) 主题树方式 主题树屏蔽了网络资源系统相对于用户的复杂性
29、,提供了一个基于树浏览的简单、易用的网络信息检索与利用界面。 信息检索由用户按照规定的范畴分类体系,逐级查看,按图索骥,目的性强,查准率高。 采用树型目录结构组织信息资源,具有严密的系统性和良好的可扩充性。限制了一个主题树体系所能容纳的信息资源数量,所以主题树结构不宜建立大型的综合性的网络资源系统。 2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)323.5 信息资源组织案例(1/4)淘宝网主页如图3-2所示,网站的信息资源组织方式可以分为信息分类组织、基于关键词的信息组织和信息直接显示三种。图3-2 淘宝网主页2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全
30、)333.5 信息资源组织案例(2/4) 1、分类组织v在淘宝网主页的左下方就是商品信息的分类目录。这个目录共有10个大类(如图3-3所示),包括:服装、配饰、家居、母婴、食品、美容、数码、文体、虚拟、服务。主页上还显示了部分大类和部分二级类目。电子商务网站对商品信息的分类揭示采用了大量的重复反映,类似于图书分类法中的交替类目。这种多角度重复,增加了用户获得信息的途径。 图3-3 淘宝的分类目录2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)343.5 信息资源组织案例(3/4) 2、基于关键词的信息组织v在淘宝网页的最上方,有一个基于关键词的搜索工具,提供了四种搜索方式:普
31、通宝贝搜索、淘宝商城搜索、店铺搜索、拍卖搜索。点击“搜索”按钮,进入淘宝搜索页面,如图3-4所示,最上方有一个基于分类和关键词的搜索工具,它包括三栏:选择搜索类别、输入关键词和选择商品分类。这种建立在分类基础上的关键词搜索,极大地提高了搜索的准确度,避免了无关信息的干扰。图3-4 淘宝网基于关键词的信息组织页面2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)353.5 信息资源组织案例(4/4) 3、信息直接显示v淘宝网还有大量对商品信息的直接显示,即直接对某种商品进行展示,如图3-5所示。图3-5 淘宝网信息直接显示页面2022-5-8第03章 信息资源组织方法(陈庄)ppt课件(全)36作 业