毕强数字信息资源开发与利用.ppt

上传人:wuy****n92 文档编号:66089231 上传时间:2022-12-14 格式:PPT 页数:53 大小:847KB
返回 下载 相关 举报
毕强数字信息资源开发与利用.ppt_第1页
第1页 / 共53页
毕强数字信息资源开发与利用.ppt_第2页
第2页 / 共53页
点击查看更多>>
资源描述

《毕强数字信息资源开发与利用.ppt》由会员分享,可在线阅读,更多相关《毕强数字信息资源开发与利用.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 数字信息资源开发与利用 内容提要内容提要数字信息资源数字信息资源数字信息资源数字信息资源开发与利用开发与利用开发与利用开发与利用 网络资源与数字信息网络资源与数字信息资源资源1 13 3 7 75 5数字信息资源采集数字信息资源采集2 2 数字信息资源开发数字信息资源开发 数字信息资源分布与数字信息资源分布与评价评价4 4数字信息资源组织数字信息资源组织 6 6数字信息资源长期保存数字信息资源长期保存数字信息资源发布数字信息资源发布9 98 8数字信息资源检索数字信息资源检索数字信息资源服务数字信息资源服务1.1.网络信息环境形成与发展网络信息环境形成与发展1 1.数字革命 数字数字bit变

2、成了信息载体的共同基因变成了信息载体的共同基因 任何载体信息都可以数字化 2 2.网络革命 任何人、任何机构随时都可以在网络上发布信息任何人、任何机构随时都可以在网络上发布信息点对点或站对站多对多信息传输环境 Internet战略地位的提升;Web(Word Wide Web)的迅速崛起;Internet对电子信息服务业的影响。1.2 Internet的运行基础及其资源 1.2.1 Internet的运行基础 Internet的组成 Internet亦称国际互联网。按字面之意是网络的网络,即网络互联之意。网络互联是网络与网络用相同的通信协议和标准或在网络间增设一接口装置进行标准转换,再用一定的

3、媒体连接。一般认为Internet是由五大部分组成:人,是指在Internet上提供、管理和生成信息的人,提供网络信息服务的人,通过使用Internet而受益的网络用户;信息资源,是指在Internet上传递的信息内容,包括书目数据、文本信息或多媒体信息;计算机;网络互联设备;通信线路,是Internet的基础设施,各种各样的通信线路把Internet的数万个路由器连接起来,把用户的计算机与路由器连接起来,可以说,没有通信线路,就没有Internet。1.2 Internet的运行基础及其资源 Internet的运行方式 Internet运行与管理方式有三种:主干网、区域网和局域网。用户将数据

4、送到网上(Upload file),其数据的运行方式为局域网区域网主干网;用户下载(Download file)数据,其数据的运行方式为主干网区域网局域网,Internet的这种运行方式又称为交互式三级结构。例如,中国教育科研网,简称CERNET,速率为9,052Mbps。它的网管中心设在清华大学,其子网分布在全国七大区的八大城市中,共有十个主节点:华北华北地区:在北京有三个主节点,分别设在清华大学、北京大学和北京邮电大学。东北地区:在沈阳有一个主节点,设在沈阳工业大学。华中地区:在武汉有一个主节点,设在华中理工大学。华南地区:在广州有一个主节点,设在华南理工大学。华东地区:在上海和南京各有一

5、个主节点,分别设在上海交通大学和南京东南大学。西南地区:在成都有一个主节点,设在成都科技大学。西北地区:在西安有一个主节点,设在西安交通大学。1.2 Internet的运行基础及其资源 互联网接入方式及网民规模 网民,中国互联网络信息中心(CNNIC)对网民的定义为:半年内使用过互联网的6周岁及以上中国公民。截至2007年12月,网民数已达到2.1亿人。中国网民数增长迅速,2007年一年增加了7300万,年增长率为53.3%。互联网逐步向各层次的居民扩散。2007年新增网民中,18岁以下的网民和30岁以上年龄较大的网民增长较快;初中及以下受教育程度的网民增长较快;低收入人群开始越来越多地接受互

6、联网;农村上网人群增长较快。(1)总体网民规模 截至2007年12月,网民数已增至2.1亿人。中国网民数增长迅速,比2007年6月增加4800万人,2007年一年则增加了7300万人,年增长率达到53.3%。在过去一年中平均每天增加网民20万人。目前中国的网民人数略低于美国的2.15亿,位于世界第二位。中国网民人数增长情况中国网民人数增长情况 中国互联网普及率中国互联网普及率 2007年才开始上网的新增网民人群中,18岁以下的网民增长较快,拉动因素之一是中小学学校的互联网接入比例在增加。此外,30岁以上年龄较大的网民增长较快,互联网呈现向各年龄阶层扩散的趋势;互联网逐步向学历低的人群渗透,初中

7、及以下受教育程度的网民增长较快;低收入人群开始越来越多地接受互联网。全球部分国家互联网普及率比较全球部分国家互联网普及率比较 尽管中国互联网发展迅速,但目前16%的互联网普及率仍比全球平均水平19.1%低3.1个百分点,与互联网发达国家冰岛、美国等差距很大。邻国日本、韩国和俄罗斯的互联网普及率均高于中国。1.2 Internet的运行基础及其资源 (2)不同接入方式网民规模 中国的宽带网民数量增长迅速。2007年12月的宽带网民数已经达到1.63亿,占网民总体的77.6%,比2007年6月增加了4094万人,比2006年12月的1.04亿增加了5938万人。宽带的快速发展是众多互联网应用快速扩

8、大发展的基础。窄带中的有线窄带,即拨号网民规模继续减少,而以手机为接入方式的无线窄带网民正在快速发展。目前已有5040万人在使用其他上网接入方式的同时,还选择使用手机上网,已经占到总体网民的近1/4(24%)。从长远看,手机与互联网会继续趋于融合。不同接入方式的网民规模(多选)不同接入方式的网民规模(多选)占总体网民比例规模(万人)宽带77.8%16,338窄带有线窄带11.1%2,338无线窄带28.0%5,880其中:手机接入24.0%5,040其中:其他无线接入5.5%1,1501.2 Internet的运行基础及其资源 ISP与 ASP 互联网可以看成由互联网接入提供商和用户两部分组成

9、,其中互联网接入提供商又可以简单分为骨干网和一般接入提供商ISP(Internet Service Provider),前者负责向后者批发互联网接入服务,而后者可认为直接面向用户零售互联网接入服务的服务商。(1)ISP Internet服务提供商的简称(ISP-Internet Service Provider),是指专门从事Internet接入服务和相关技术支持及咨询服务的公司或企业,是众多企业和个人用户进入Internet空间的驿站和桥梁。1997年,出现了两个Internet代名词_互联单位和接入单位,这是国家承认的对国内Internet服务机构的分类和称谓。互联单位指有资格设置独立国际

10、出口(连接国外Internet的通信线路)的Internet服务机构,它通常是具有全国规模或者预期具有全国规模的互联网络。接入单位是不具有独立的国际信息出口的Internet服务机构。1.2 Internet的运行基础及其资源 ASP(Application Service Provider)应用服务供应商,顾名思义就是向用户提供一切可能的Internet应用服务。说得更形象一些,就好比现在流行的“商务中心”向客户提供各种复印、传真等服务业务一样,ASP向其用户提供各种Internet应用外包租用服务业务。ASP向用户提供服务应用系统本身属于ASP,用户租用服务之后对应用系统拥有使用权;应用系

11、统被集中放置在ASP的IDC(Internet数据服务中心)中,具有充足的带宽、电力和空间保证;ASP按月向用户收取服务费。阻碍ASP发展的方面在于:目前,由于安全及保密等诸多方面原因,企业用户对ASP的需求数量还很有限;由于基本建设等因素,用户的接入速度还远远满足不了电子商务实时交易的要求;各ISP的服务能力和水平各不相同,很容易给用户带来不必要的麻烦,急待主管机关规范这方面市场;市场仍有待于教育与培养。1.2 Internet的运行基础及其资源 1.2.2 Internet基础资源 2007年中国互联网基础资源的发展与网民的发展势头相似,同样处于快速发展的阶段。IP地址和域名是互联网的基础

12、地址资源,中国的IP地址数达到1.35亿个,年增长率为38%。目前每万人拥有的IP地址是1,029个,每万个网民拥有的IP地址则是6,442个。中国域名总数是1193万个,年增长率达到190.4%。增长的主要拉动因素来自CN域名,CN域名数量已达到900万个,比2006年同期增长了接近4倍。中国网站数量已有150万。这些网站中增长最快的是.CN下的网站数,目前的数量已经达到100.6万个,.CN下网站首次超过百万,占到中国网站数的66.9%。中国网页总数已经有84.7亿个,年增长率达到89.4%,是2007年互联网基础资源中增长最快的一项,互联网上的信息资源数量日趋丰富。1.2 Interne

13、t的运行基础及其资源 互联网区域基础资源的发展与地区经济发展水平存在相关性,无论是从IP地址,还是从域名、网站上看,北京、上海、广东、浙江和江苏的拥有量都居于前列,比其他省份的拥有量要多。其他省市要尽快提高当地互联网基础资源的发展水平,还需要从经济发展等多个相关方面同时着手。互互联联网基网基础资础资源数量增源数量增长长情况情况2007年12月总量每万人拥有量每万网民拥有量2006年12月总量年增长率IPv4地址(个)135,274,752 1,029 6,442 98,015,744 38.0%域名(个)11,931,277 91 568 4,109,020 190.4%其中:CN域名(个)9

14、,001,993 68 429 1,803,393 399.2%网站(个)1,503,800 11 72 843,000 78.4%网页(个)8,471,084,566 64,444 403,385 4,472,577,939 89.4%网页字节(KB)198,348,224,198 1,508,948 9,445,154 122,305,737,000 62.2%国际出口带宽(Mbps)368,927 3 18 256,696 43.7%1.2 Internet的运行基础及其资源 IP地址 20世纪70年代美国国防部开发出IP,并逐渐发展成为今天的广泛使用的IPv4。IPv4提供统一编址,最

15、大努力发送分组等主要功能,为Internet的发展奠定了坚实的基础,以至于今天它几乎成为唯一的网络层通讯协议。在IPv4地址资源上,发达国家占优势地位,59.7%的IPv4地址资源都集中在美国。目前中国拥有的IPv4数量是1.35亿个,占全球IPv4地址数量的4%,仍排在美国、日本之后,位居世界第三。中国的IPv4地址量增长一直比较迅速,尤其是2006年以来,在中国互联网络信息中心(CNNIC)等机构的大力推动下,呈现较快的增长势头。中国中国IPv4地址数量增长情况地址数量增长情况 1.2 Internet的运行基础及其资源 根据IPv4地址的剩余数量状况,预计到2012年,全球IPv4地址将

16、会完全耗尽。但目前亚太地区互联网快速发展,IPv4地址仍呈现出快速消耗的趋势。在IPv6没有完全商用之前,IPv4地址仍旧是互联网赖以生存的根本。因此,加速申请以扩大中国IPv4地址资源的数量,是中国尤其需要重视的问题。目前,欧美发达国家都在积极地推进IPv4到IPv6的过渡工作,就长远的计算机网络发展来看,IPv4地址存在着发展的局限问题:首先,IPv4的地址资源有限,已经不能适用于国际互联网的发展需要;再者,美国控制大多数地址资源,其他国家的发展受到严重制约。相反,IPv6地址资源丰富,安全性能大幅提高,还有大量的IPv6地址可以申请。所以向IPv6过渡有利于今后的中国互联网络发展。目前I

17、Pv6地址还处于试验阶段。与IPv4相比,IPv6优势突出,可以无限满足互联网地址资源的需求。在中国地区共分得IPv6地址27块/32,处于全球第十五位。前五位则为德国、法国、日本、韩国和意大利。1.2 Internet的运行基础及其资源 域名 域名在本书中仅指英文域名,是指由点(.)分割、仅由数字、英文字母和连字符(-)组成的字串,是与IP地址相对应的层次结构式互联网地址标识。入网的每台主机都具有类似于下列结构的域名:主机名.机构名.网络名.最高层域名 例如,东方网景的一台与Internet联网的主机的IP地址为202.96.51.2 域名为W,其含义为:主机号Web.东方网景.网络中心.中

18、国1.2 Internet的运行基础及其资源 (1)域名命名的一般规则 标准名称的命名规则与IP地址相反,自右向左越来越小。域名是分级的、有层次的。(2)域名的分类 根据全球互联网域名体系的规定,域名种类分为通用顶级域名(gTLD)和国家与地区顶级域名(ccTLD),两者同属于国际顶级域名。顶级域名 含 义 说 明 gov 政府部门 通常限于美国使用 edu 大学和其他教育机构 int 国际组织 com 商业和工业组织 mil 军事部门 通常限于美国使用 net 网络运行和服务中心 org 其他组织机构 美国或全球顶级域名美国或全球顶级域名 1.2 Internet的运行基础及其资源 CN域名

19、是由中国管理的国家与地区顶级域名,有着中国的身份烙印,称为域名的中国概念。CN下的二级域名分为两类:第一类叫做“类别域名”,主要是依据行业来划分域名,类别域名6个,AC(适用于科研机构)、EDU(适用于教育机构)、COM(适合于工、商、金融等企业)、GOV(适用于政府机构)、NET(适用于接入网络的信息中心-NIC和运行中心-NOC)、ORG(适用于各种非盈利性组织);第二类叫做“行政区域类”,这一类二级域名的划分根据的是我国的行政区划,例如,WEB.CC.JL.CN,吉林信息港。CN域名数量的增长及使用比例的增加,对加强中国互联网络网络安全和信息安全有重要意义。中国政府一直致力于推动中国CN

20、域名的发展。目前中国CN域名数量已达900万,年增长率达到399.2%,在过去一年中平均每天增加CN域名2万个,增长势头迅猛。与其他国家顶级域名相比,目前中国仅次于德国的国家顶级域名DE(1128万个),位于世界第二。CN域名数量增长情况域名数量增长情况中国分类CN域名数数量(万个)占CN域名总数比例.CN569.5 63.3%.COM.CN253.5 28.2%.NET.CN33.5 3.7%.ADM.CN22.0 2.4%.ORG.CN16.4 1.8%.GOV.CN3.5 0.4%.AC.CN1.3 0.1%.EDU.CN0.3 0.0%.MIL.CN0.0 0.0%1.2 Intern

21、et的运行基础及其资源 (4)CN域名的价值 由于所有域名都具有识别功能、宣传功能以及它们的唯一性、排它性和全球性,使得域名成为了不可或缺的战略性资源。CN域名由于其特殊的身份,并且成长在最具经济活力的区域,所以更具有许多优秀的品质,形成其独特的资源价值、品牌价值、投资价值和安全价值等。(5)域名的信息功能 指示网站所含信息资源的性质。易于记忆。1.2 Internet的运行基础及其资源 网站网站 是指以域名本身或者“WWW.+域名”为网址的Web站点,其中包括中国的国家顶级域名.CN和类别顶级域名(gTLD)下的Web站点。如:对域名来说,它的网站只有一个,其对应的网址为或,除此以外,等以该

22、域名为后缀的网址只被视为该网站的不同频道。目前中国网站数量已达150万个,比去年同期增长了66万个,增长率达到78.4%。博客/个人空间等众多网络应用需求、域名数量增长的拉动及创建网站操作的简单化等因素作用在一起,共同使得网站数量猛增。中国网站数量增长情况中国网站数量增长情况 中国分类网站数中国分类网站数数量(万个)占网站总数比例.CN100.6 66.9%.COM42.7 28.4%.NET6.1 4.1%.ORG0.9 0.6%合计150.4 100.0%这些网站中,增长最快的是.CN下的网站数,目前的数量已经达到100.6万个,.CN下网站首次超过百万,占到中国网站数的66.9%,CN域

23、名成为我国网站使用的主流域名。1.2 Internet的运行基础及其资源 网页网页 网页可分为静态网页和动态网页。静态网页,指URL中不含“?”和输入参数的网页,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。动态网页,指URL中含“?”或输入参数的网页,包括ASP、PHP、PERL、CGI等在Server方进行处理的网页。目前中国网页数为84.7亿个,年增长率达到89.4%,网上信息资源的增长速度非常迅猛。这些网页中,动静态的比例为0.92:1,动态网页的比重在逐年增高。中国网页数中国网页数网页总数8,471,084,566个静态网页数量4,065,690,936个

24、占总网页数的比例48.0%动态网页数量4,405,393,630个占总网页数的比例52.0%静态/动态网页的比例0.92:1网页长度(总字节数)198,348,224,198KB平均每个网站的网页数5,633个平均每个网页的字节数23.4KB中国网页数量增长情况中国网页数量增长情况1.2 Internet的运行基础及其资源 国际出口带宽国际出口带宽 所谓带宽,是“频带宽度”的简称,原是通讯和电子技术中的一个术语,指通讯线路或设备所能传送信号的范围。网络中的带宽是指在规定时间内从一端流到另一端的信息量,即传输线的通频带宽度。对于数字传输系统,也可以用“码速率”来表征它的带宽,每秒钟传送多少个二进

25、制位。单位是:位/秒,用符号表示:bit/s或者b/s。带宽越宽,码速率的值越大,此时上网速度越快。这很类似于一条公路可以并排走多少辆汽车,或是一条排水沟一秒钟可以通过多少立方米的水。码速率也称为传输速度或者传输速率。目前中国的国际出口带宽已经有368,927Mbps,年增长率达到43.7%,中国与国际互联网连接的能力进一步增强。中国国际出口带宽增长情况中国国际出口带宽增长情况 八家骨干网的国际出口带宽数八家骨干网的国际出口带宽数国际出口带宽数(Mbps)中国公用计算机互联网(CHINANET)198,353 宽带中国CHINA169网138,887 中国科技网(CSTNET)8,810 中国

26、教育和科研计算机网(CERNET)9,052 中国移动互联网(CMNET)8,260 中国联通互联网(UNINET)4,319 中国铁通互联网(CRNET)1,244 中国国际经济贸易互联网(CIETNET)2 合计368,927 从这些数据我们不难看出:我国政府对发展电信基础环境和信息资源方面 高度重视;反映了我国互联网络在飞速发展,网络带宽资源也在飞速发展;我国互联网的访问瓶颈问题已得到较大改善。1.3 Internet数字信息资源 1.3.1 何谓数字信息资源何谓数字信息资源 Internet数字信息资源,是指所有以数字形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的

27、载体中,通过网络通信、计算机或终端再现出来的资源。高新民按运行机制划分,把数字信息资源分为公共数字信息资源和商用数字信息资源,其中公共数字信息资源包括政务公开信息和公益信息资源两大类。美国将公共信息定义为公共领域信息,指所使用数据和信息的来源和类型不受知识产权和其他法定制度的限制,公众可以不需要授权、无限制地获得的数据和信息。俄罗斯按开放程度提出国家信息资源概念,即公开的和人人都能获取的信息。数字资源磁、光软磁盘、硬盘、光盘、磁带等多媒体、数据库、音频、视频等按内容分网络资源原生资源派生资源未在物理资源上发表过、在公开场合发表过以电子文档形式为主、在网络上直接创造与发表等物理媒体上发表也在网络

28、上发表并滞后于物理资源、从物理资源加工而来、从其他已经存在的形态转变而来以 Bit方 式保存,依赖于计算机才能使用的资源数字信息资源分类数字信息资源分类知识资源结构知识资源结构清华同方清华同方中国期刊全文数据库中国期刊全文数据库超星数字图书馆超星数字图书馆万方期刊数据库万方期刊数据库1.3 Internet数字信息资源 1.3.2数字信息资源分类的原则及其类型数字信息资源分类的原则及其类型 分类原则 基于开发利用目的的数字信息资源的分类原则是:数字信息资源的分类需符合公众思维习惯;数字信息资源的分类需讲求经济性原则;数字信息资源的分类需讲求可行性原则。数字信息资源类型数字信息资源类型 从信息检

29、索的角度对数字信息资源进行分类:(1)按发布形式分 书目、索引、文摘型的二次文献数据库;查阅知识条目的参考型三次文献数据库;期刊文献数据库;其他文献型数据库。1.3 Internet数字信息资源(2)按发布机构分 政府网站信息资源。政府网站提供各类信息的比例 1.3 Internet数字信息资源 企业网站信息资源。这类资源站点一般以COM为一级或二级域名注册。如:http:/WWW(摩托罗拉公司/),其信息资源一般以初始信息为主,如提供公司总体概况,各类产品信息、商业服务信息等。企业网站提供各种信息的比例 1.3 Internet数字信息资源 商业网站信息资源。商业网站提供各类服务的比例 1.

30、3 Internet数字信息资源 教育科研网站信息资源。这类网站一般以edu或ac为一级或二级域名注册,如http:/WWW(吉林大学/),信息表现为初始源和再生源共存,主要提供学术性较强的各种信息,如科研活动介绍、学术动态、信息检索、远程教育等。教育科研网站提供各类信息的比例 1.3 Internet数字信息资源 个人网站所提供的主要信息有“BBS(43.5%)”、“娱乐(35.7%)”和“学术讨论(24.9%)”等。个人网站提供各类信息服务的比例 1.3 Internet数字信息资源 全国在线数据库的总量为29.54万个。其中,企业网站拥有的在线数据库数量最多,占全部在线数据库的50.4%

31、;其次是个人网站拥有的在线数据库,占全部在线数据库的21.5%;政府网站拥有的在线数据库排第三位,占全部在线数据库的9.4%;其他公益性网站的在线数据库占7.3%;教育科研网站的在线数据库占6.4%;商业网站拥有的在线数据库占4.5%;其他类型网站的在线数据库占0.5%。各类网站拥有的在线数据库占全部在线数据库的比例 1.3 Internet数字信息资源 (3)按传输协议分 Web信息资源。网络论坛。主要包括:新闻组(Usenet)、电子论坛(Mailing List)、电子公告(BBS)、专题讨论组(discussion Group)等。FTP。在TCP/IP网络应用中,文件传输协议FTP(

32、File Transfer Protocol)专门用于文件传输服务,主要提供文件下载、Web网站维护、文件交换与共享等服务,它是目前最重要的、应用最多的 Internet服务之一。Gopher。Gopher是一种基于菜单的网络信息系统。网络新闻。网络新闻在网络受众的眼中就是传统媒体的网络版本。BBSGopher Menu1.3 Internet数字信息资源 1.3.3 数字信息资源的特点 数字信息资源是一种新型数字化资源,与传统文献相比有较大的差别,了解数字信息资源的特点,有助于对数字信息资源的开发利用。从信息检索的角度来讲,数字信息资源具有以下特点:(1)从内容上看:数量上的海量化;种类繁多;分布开放,内容之间关联程度强。(2)从形式上看:非线性;无序性增强;交互性。(3)从效用上看:共享性;时效性;强转移性;强选择性;高增殖性。(4)从检索上看:信息通道的双向性和信息检索的网络性;关联度强,检索快捷。谢谢大家!谢谢大家!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁