《毕业设计(论文)-电子商务环境下商情数据库的发展策略研究(13页).doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)-电子商务环境下商情数据库的发展策略研究(13页).doc(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-毕业设计(论文)-电子商务环境下商情数据库的发展策略研究-第 13 页电子商务环境下商情数据库的发展策略研究摘要 商情数据库不仅是数据库产业发展的基础,更是世界经济发展的支柱,21世纪电子商务的兴起给商情数据库的发展带来了巨大的影响。本文介绍了当前国内外商情数据库发展的一般水平,通过对国内外几个大型商情数据库的比较得出我国商情数据库发展中存在的不足。并对电子商务的发展给商情数据库带来的影响进行了分析研究,认为电子商务环境在数据库的数量、数据获取和更新速度等方面会产生积极的作用,而在数据质量和数据库利用率方面存在一定的问题。最后,文章通过分析电子商务环境下商情数据库发展的特点,为提高数据质量和
2、数据库利用率提出了可行的解决方案。同时还提出增加载体类型,促进信息的服务与传播,并实施收费政策,实现商情数据库建设的可持续发展。关键词 电子商务 商情数据库 发展策略The Research of Development Strategy About Business Databases In E-commerce EnvironmentAbstract Business Databases are not just the base of database industry, but also the pillar of global economy. In 21st century the
3、 rise of e-commerce has brought enormous impact on the development of business databases. This paper introduces the average level of business databases at home and abroad, finding the deficiencies in the development of Chinas business databases by comparison of some large business databases worldwid
4、e. And it analyzes the influences that E-commerce brings to the development of it, good in quantity, data acquirement and renew speed, but bad in data quality and utilization of databases. In the end, the paper advances feasible solutions to improve data quality and utilization of databases by analy
5、zing the features of the development of business databases in e-commerce environment. It also advances increasing the type of carrier to improve the services and communications of information, and implementing charging policies to achieving the sustainable development.Keywords E-commerce , business
6、databases, development strategy 1 引言11 研究背景商情数据库是指那些提供与商务活动密切相关的各类信息的数据库。改革开放以来,我国信息服务行业的发展非常迅速,但是商情信息反馈缓慢、低效,严重阻碍了经济的发展。充分利用现代信息技术手段,建立高质量、大型的商情资源库,疏通商业运转中的信息渠道,为企业提供一个良好的信息环境,是目前促进商业和经济发展的必要手段之一2。中国互联网络信息中心的调查表明,自1997年开始,我国因特网用户呈现几何级数增长。截至2007年12月,网民数已达到2.1亿人。2007年一年增加了7300万,年增长率为53.3%14。因特网的迅速扩展为
7、我国电子商务活动提供了极为广阔的发展空间。而为商业发展提供重要信息的商情数据库自然也因电子商务的兴起发生了重大变化。这种变化不仅仅表现在数量上,更表现在数据库的建设途径和维护工作上。12 国内外研究现状由于我国商情数据库建设时间不长,专门针对它的研究并不多。尤其是在近几年,由于搜索引擎的发展,人们对专业数据库的关注度降低了。而CNNIC一些信息机构的研究多是针对数据库产业整体的发展,对商情数据库这一局部的介绍有限。鉴于商情数据库对经济发展的指导作用,对它的发展现状和趋势进行专门的研究和探讨是非常有必要的。13 本课题的研究内容131主体内容。论文主体分为三个部分:第一部分介绍国内外商情数据库的
8、发展情况,第二部分通过对数据的对比分析得出电子商务对商情数据库发展的影响,第三部分提出我国商情数据库目前尚待改进的地方和可能的发展趋势。132 研究方法。论文第一部分采用文献研究法,通过图书馆和互联网收集已有文献中有关各国商情数据库的资料,整理分析得出国内外商情数据库发展概况。第二部分采用定量分析法,将商情数据库的数量和更新速度等数据制成图表,进行对比分析后得出结论。第三部分采用探索性研究法,将商情数据库已有的发展状况和发展规律结合自己的理解,给出商情数据库未来的发展策略。2 国内外商情数据库发展概况21 国外商情数据库的发展211 美国商情数据发展史。美国是商情数据库建设及其信息服务起步最早
9、、发展最快的国家。目前在世界范围内, 仍占据极大的优势。美国数据库产业在激烈的国际竞争中之所以获得优势,一直以来能够牢牢保持世界信息资源“超级大国”的地位,主要有以下四个方面的原因。(1)发展初期得到政府重视。美国政府一再强调信息技术和信息产业发展的核心地位,同时多次通过政府资金投入,确保信息技术的发展。1993年9月15日美国总统克林顿制定并颁布了最具划时代意义的重大战略决策美国国家信息基础设施:行动计划(即NII计划),同时确立了“重点建设数据库,促进网络资源开发和利用”的战略发展重点。(2)颁布信息政策法规,规范信息发布环境。美国政府先后颁布了电子化信息自由强化法案、知识产权与国家信息基
10、础设施:白皮书、美国个人隐私权与国家信息基础设施:白皮书、电信法等系列法规,这些政策法规对规范网络信息发布环境,提高商情数据库数据收集的准确性和数据质量起到了很大的作用。(3)发展后期逐渐转入商业化经营。70年代,随着美国政府大大削减对二次信息产品的无偿资助后,数据库生产者为了生存,及时采用了商业化的经营方式。数据库生产与经营逐渐向商业届发展,为以后商情数据库的继续发展提供了更大的空间和经济支持。(4)数据库产品类型多样化。美国国内数据库市场竞争激烈,各大数据库生产商和服务商为增强实力并吸引用户,充分利用计算机、远程通讯、高密度存储介质和软件技术在信息处理和加工中的优势,同时不断的改进技术,更
11、新设备,根据用户的需要设计开发新产品,尽快使其产品适应市场的运行机制,大大提高了产品的竞争力。212其他国家商情数据发展史。(1)西欧数据库产业发展十分迅速。经过10年的发展,西欧数据库数量由1473种增加到了3546种,数据库数量增加了1.4倍,所占比例由1991年的24逐年上升到30,位于第二。(2)亚洲在世界数据库分布比例中名列第三。虽然亚洲仅占4,但经过十年的发展数据库已由183种,发展到418种,数据库数量增加了1.28倍。这表明数据库在亚洲的发展比较快,但由于语言障碍,增加了亚洲数据库进入世界的难度。(3)非洲和南美数据库可以说基本没有发展,而且有下降趋势。非洲数据库数量1991年
12、为7种,虽然10年间最高增加到19种,但在2000年却又减少到8种;南美洲从1991年的44种逐年下降,到2000年时已降到24种,减少率55。22 我国商情数据库的发展我国商情数据库建库工作是从80 年代初开始的,但直到90年代,商情数据库才开始真正起步。1993 年2 月18 日,我国第一家数据库专业开发制作公司北京万方数据公司宣告成立,它不仅标志着我国专业化数据库企业运营的开始,同时也标志着我国商情数据库及数据库产业化、市场化的开始。到目前为止,我国商情数据库最具影响力的经典之作应该首推“万方数据”的“中国企业、公司及产品数据库(CECDB)”,该库目前有中、英文及Big5 码三种版本,
13、自1989 年至今中文版已出14 版(种),英文版已出8 版(种)。该数据库的数据源由企业直接提供,2006版现已收入我国近20万家企业的详尽信息。该库拥有国内外用户近万家,联机系统年检量达10万人次,是国内最具权威的综合类商情数据库1。从构成商情数据库的各方面因素来看,我国商情数据库主要具有以下特点:(1)发展起步晚。我国商情数据库在各类数据库中所占比例较低,在数量上明显落后于国外其他信息产业发达的国家。一般来说,商情数据库数量和类型是伴随着数据库的发展而不断增长的。1995年,中国的商情数据库数量有297种,而同年美国商情数据库就已达1934种13。同时由于发展时间不长,导致商情数据库内容
14、覆盖范围狭窄,不能对经济的发展起到有效的指导作用。(2)商业化程度低。数据库建库单位的背景及其资金来源决定其生产数据库目的和商业化程度。一般来说,一个数据库生产能够不完全依靠政府拨款作为资金来源,所建数据库能够面向市场,以市场为驱动力、用户为导向,走市场化的道路,那么就可以说这个数据库的商业化程度较高,能适应市场的需要,具有一定的市场竞争力。由于在商情数据库建设的初期,我国主要的数据库生产机构多从属于政府部门,资金来源于政府。随着事业单位事业经费的日趋紧张,导致数据库不能推向市场,广泛缺少用户。这一方面造成信息不能利用;另一方面,很多数据库由于得不到回馈,更新周期增长,更新渠道不畅,最后成为无
15、人问津的“死库”。而一些由非事业型单位建立的数据库由于可获得信息的渠道不多,内容覆盖范围不够广泛,不能形成规模。23 国内外商情数据库发展现状比较我们将国内外几个典型的大型商情数据库的基本情况制作成表格,可以直观地看出目前世界上商情数据库发展的现状。表21 国外大型商情数据库ABI/INFORMATIONBSPGale Business Resources3类型综合数据库报刊文摘数据库企业信息数据库收录期刊数3844种2350种全文期刊2868种1685种公司信息20多万家455000家回溯年限1905年1990年1986年更新频率每日更新每日更新每日更新包含领域商业环境与贸易条件、市场发展趋
16、势、企业经营战略和战术、管理技巧、产品竞争信息、与管理相关的科学技术国际商务、经济学、经济管理、金融、会计、劳动人事、银行等涵盖了全球的公司,产品,工业信息数据来源ProQuest Information & Learning Co.EBSCOGale表22 国内大型商情数据库China InfoBank4中经网统计数据库CECDB类型综合数据库报刊文摘数据库企业信息数据库收录期刊数100多种300种全文期刊公司信息27万家17万家回溯年限1995年1991年1988年更新频率每日更新每日更新每日更新包含领域实时财经新闻、权威机构经贸报告、法律法规、商业数据及证券消息等全国各地及国家各部委办的
17、经济新闻、统计数据、专家分析、研究报告、法规文献等各类信息及其他相关信息工商资讯、经贸信息、咨询服务、商贸活动等数据来源中国千余种报章与期刊及部分合作伙伴提供的专业信息国家信息中心等权威研究机构, 公开出版、发行的经济专业报刊杂志, 政府、企业、媒体的内部刊物, 经济研究专家万方数据股份有限公司从上面两个表格可以看出:在数量上,我国商情数据库收录的期刊数和国外商情数据库还存在约10倍的差距,所收录的公司信息数量也只有国外商情数据库的一半;在时间上,我国商情数据库的可回溯年限平均晚国外31年;在范围上,我国商情数据库包含的大多是本国的商业信息,而国外很多大型商情数据库都涵盖了全球的商业信息;只有
18、在更新速度上,我国商情数据库的发展与国外保持在一个数量级。因此,就目前的发展现状来看,我国的商情数据库建设与国际水平还存在很大差距。图3。1 20012005年商情数据库占数据库总量的比例3 电子商务的发展对商情数据库的影响电子商务不仅是网络技术应用的全新发展方向,更是已经超越了作为一种新的贸易形式所具有的价值,正在改变企业本身的生产、经营与管理活动,甚至影响到整个社会的经济运行与结构。可以说,在电子商务环境下,人类从事经济活动的许多基本游戏规则将因此而发生深刻的变化。31 数量的影响我们选取2001年至2005年商情数据库发展的资料,制成下图(图中数据由CNNIC 2001至2005年中国互
19、联网络信息资源数量调查报告5整理而成):同时,我们将2001年至2005年我国电子商务的发展情况也制成波形图(图2)。比较两个图形发现,2001至2005年间,我国商情数据库的发展状况和电子商务交易额增长率的发展趋势有着惊人的相似,可以说,电子商务的发展直接促进了商情数据库的发展。 图3。2 20012005年电子商务交易额增长率 (资料来源:iResearch)事实上,我们统计的商情数据库属于在线类型,它的存在形式与电子商务一样,都是依赖互联网的发展而发展的。商情数据库所收录的有关公司、产品、市场行情、商业动态、金融活动、专利、标准及有直接关联的税法、国家政策等方面的信息,在电子商务环境下会
20、越来越多,收集也越来越快捷,使用也越来越方便。随着电子商务的进一步发展,商情数据库不仅收录的商务信息增多,而且商情数据库占数据库总量的比例也在增加;反过来,商情数据库的增加也会促进电子商务的发展。我国电子商务的发展之所以在2002年后有一个起伏,是因为随着1999年商业化电子商务平台不断崛起,第一代电子商务网站相继建立。而到2001年网络业泡沫破灭时,我国75以上的第一代电子商务模式退出了市场。所以2002年后,电子商务的发展走入低谷。iResearch预测,2004年是网络复苏并繁荣的一年,从2005年起中国电子商务市场将会迎来第二个高速的增长期。之所以会有这样的预测,并不是凭空臆断的。20
21、04年2月,阿里巴巴宣布获得8200万美元的战略投资,这是中国互联网业迄今为止最大的一笔私募基金。2004年6月,百度宣布,包括美国前三大风险投资商之一的DFJ和全球著名搜索引擎Google在内的八家风险投资机构对百度进行的策略融资已经完成。截至2004年第三季度,50家活跃VC对互联网投资项目超过24个,投资金额超过1.4717亿美元;而2003年截至第三季度这50家活跃VC对互联网投资项目仅为7个,投资金额也只有7620万美元。这些投资不仅促进了我国电子商务的壮大,同时也让商情数据库的发展步入新纪元。尽管2002年后,从图中看电子商务的发展走入低谷,但实际上正孕育着新兴的第三方交易平台的发
22、展,所以从2004年起中国电子商务市场又迎来了第二个高速增长期6。32 数据来源的影响 321 政府文件和报刊。商情信息涉及市场、产品、企业、金融等诸方面,分散在报刊、杂志、新闻、政府信息部门、企业内部信息网及商业活动等诸多领域之中。从媒介上看,前期商情数据库中的数据主要来源于政府发布的文件及报刊上的文章。据统计,目前80以上的社会信息资源、3000多个行业分类数据库掌握在政府部门手中。但由于市场化程度不高,渠道不畅,这些信息很难流动到市场上来,而来源于基层的工业、农业、商业信息大部分因为缺乏有效的信息收集、加工、发布体系而自生子灭。而对于拥有信息处理技术、信息发布体系的商情数据库建库者来说却
23、只能收集到大型报刊杂志等公开出版信息或其他二手信息,使得商情信息资源不足,数据的可靠性和准确度没有保证。322 互联网。随着互联网的普及,报刊杂志等纸质的数据来源相对滞后了,更多的商业信息在第一时间直接反映在网络上。因此在电子商务环境下,为保证数据库的使用价值,商情数据库的建设者把网络作为数据的主要来源。但由于网络上的数据量大而且繁杂,数据的收集和处理成为建库者必须面对的难题。现在广为人知的搜索技术解决了大量数据的收集问题,Search engine spider(搜索引擎爬行抓取蜘蛛7)可以把互联网上所有的网页都抓取下来,但从这些网页中筛选所需信息就不是那么容易了。Search engine
24、 spider可以通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。但对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。这其中的原因一方面是抓取技术的瓶颈,无法遍历所有的网页,有许多网页无法从其它网页的链接中找到;另一方面是存储技术和处理技术的问题,即使能够存储,下
25、载也存在问题。同时,由于数据量太大,在提供搜索时也会有效率方面的影响。而且与报刊杂志所不同的是,网络上的数据大都是没有经过加工的一次信息,要利用这样的信息,建库者要做的不仅是选择,更重要的是加工,这无疑又加大了工作量。从数据的原始所有者来看,电子商务环境下的数据源更加广泛。政府部门网站、企业门户网站、第三方交易平台等都存有大量的商务信息,这些商务信息绝大部分都是公开且免费的。问题在于如何使这些信息增值,包括信息重组、数据挖掘等。33更新速度的影响 331 商情数据库更新的重要性。直接与商业联系的商情数据库需要强大信息市场做后盾,以灵活、高效的信息手段及时收集商业运转情况方面的信息,这样才能为商
26、业活动提供及时、有效的信息支持。而且由于市场千变万化,已经建成的商情数据库必须及时记入或修改已发生变化的信息,才能真正提供有效的商情服务。这就涉及到数据库的更新维护工作。数据库的维护工作是一个数据库成功与否的决定因素。尤其是商情数据库,在更新维护工作的重要性要远远超出学术型数据库,一个商情数据库无论在建库时做了多大的投入,如果不能及时更新和补充,那么前面的努力就会白费,就会成为无人问津的死库。而商情数据库更新维护工作的力度和难度又要比学术型数据库大了很多,对于学术型数据库只需要不断补充增加新的收录材料,不必修改原有的信息,而商情数据库的建设不仅要增加新的商情信息,而且要求新增的内容不能与原有的
27、重复,同时要对原有的信息进行核实更新。比如企业名录信息库和产品信息库,每次的更新就要求新增数据不能重复,原有的数据要再次进行核实,删除已倒闭的企业和停产的产品,更新已发生变化的信息。理想的商情数据库更新应该是全面而准确的更新,而且这个更新周期要尽可能短,这样才能提供用户更有效及时的信息服务。因此商情数据库的更新工作是一项非常困难的工作,其难度不亚于重新建设一个新库。332 电子商务影响下商情数据库的更新速度。在电子商务飞速发展的今天,计算交易额的周期已由“月”改为“日”,商情数据库的更新速度自然也需要跟上其发展的步伐。根据中国互联网络信息资源数量调查报告提供的数据,我们绘制了一个更新周期变化图
28、(图3),可以看出,2003年至2005年我国商情数据库每日更新的比例逐年增加,每周更新和每月更新的比例处于持平状态,而每半年才更新的数据库比例明显下降,可见整体上商情数据库的更新速度处于上升趋势。图3。3 20032005年商情数据库的更新周期而促使商情数据库更新速度发生变化的主要因素有二:一是电子商务的发展推动了信息技术的发展,使实时的商业信息能够在第一时间反应在网络上,并利用各种工具全面而准确的获取即时信息。二是电子商务的发展加快了信息失效的速度,迫使商情数据库的建设者加快数据库更新速度,以保证数据的时效性。4电子商务环境下商情数据库的发展策略从2005年中国互联网络信息资源数量调查报告
29、中可以了解到,各种公益性网站、政府网站及商业网站中拥有在线数据库的网站比例较高,分别为37.8%、36.3%和31.7%。在拥有在线数据库的网站中,拥有“产品信息数据库”的网站最多,占到61.0%;拥有 “企业名录数据库” 的网站为20.4%; 拥有“报刊新闻数据库”的网站为17.0%。可以看出,未来的商情数据库中在数量上将以企业及产品数据居多、免费使用居多以及本地数据库居多,提供深入分析的数据及其它具有价值增值的数据库还需进一步发展。41提高数据质量,保证用户的使用效果数据质量反映出数据对特定应用的满足程度。而数据质量的评价指标主要包括5个方面:可达性、完整性、时效性、正确性和一致性8。表4
30、1 数据质量的评价指标评价指标评价内容计算方法补充说明可达性衡量数据量的大小对应用的满足程度可达性应用能够获取的数据量/ 应用所要求的数据总量100例如为了分析2000年至2005年间某商情数据库数据更新情况,需要得到这5年的历史数据,但2000年的数据没有保存,所以可达性4/510080。正确性表示数据库中的数据与客观世界的符合程度正确性表中正确的数据量/ 表中的记录总量100例如某公司记录的企业名录中有企业更改了企业名称,如数据库没有进行更新,就会使数据库中数据的正确性受到影响。设该数据库中共有100条企业记录,其中2条未更新,则正确性98/10010098完整性表示信息的完整程度,包括三
31、个方面:实体完整性、引用完整性和域完整性完整性数据集中所有满足条件(可以是三者之一)的数据量/ 集合中记录总数100。实体完整性要求一个表中的每一行必须是唯一的;引用完整性定义了一个关系数据库中不同的表的相关列的之间的引用关系;域完整性要求表的某一列的数值在该列的合法的数值范围内。设某数据库中共有数据100条,其中两条数据的数值不在该表的合法数值范围内,则该数据库的完整性98/10010098一致性衡量对于特定的规则,数据库中所有的表是否都满足这样的规则一致性数据库中所有满足条件(针对某个具体规则) 的数据量/ 被考察的记录总数100 例如,某数据库中若规定电子商务表示为“EC”,那么该数据库
32、中其他数据对电子商务的表达都要依照此方式。设该数据库中共有100处涉及到电子商务的表达,其中只有98处为“EC”,则该数据库的一致性98/10010098时效性考察数据的时间特性对应用的满足程度时效性数据集中所有尚未失效的数据量/ 集合中记录总数100 例如,在此次汶川地震中,当地受灾企业的数量在不断变动中,没有及时更新的数据很快就失去时效性。设某数据库共有信息10000条,其中有效信息量为9800条,则该数据库的时效性9800/1000010098随着商情数据库的更新速度愈来愈快,不管在时间上还是空间上,商情数据库中收录数据的可达程度越来越高,完整性和时效性无疑也与信息技术的发展成正比。但电
33、子商务时代,互联网虚拟的特性却使数据的正确性和一致性遭到了破坏。畅通的网络让人们可以以各种身份通过各种方式发布信息,其中不乏欺诈和虚假数据,从而导致信息处理过程中出现数据错误。而通过各种渠道发布的信息,一致性非常低,大大增加了信息收集和处理的难度。控制信息发布的渠道以提高数据的正确性几乎是不可能的,我们只能通过审核信息发布人的身份,也就是所谓的“实名制”来提高发布信息的可信程度,并进一步改善数据库的更新情况,以达到提高数据正确性的效果。而提高数据的一致性相对来说比较容易,只要制定一套统一的规则,并采用一定强制性手段让人们发布的信息符合相应标准,就可以大大提高数据库的一致性。42充分发挥信息技术
34、的优势,提高数据库利用效率虽然现在商情数据库的使用已如此之广泛,但并不意味着它的使用具有方便和高效性。目前使用者面对的最大难题就是信息的快速接收和处理。计算机的信息处理速度和能力在迅速增长,而人类大脑对信息的接收处理速度则成为一个瓶颈。美国的心理医学研究人员发现,现在人类所处于的知识时代的信息大爆炸反而使人无法再吸收新的知识,人们的大脑会因为充斥着超过人脑处理能力的信息而达到了饱和状态,使人的大脑发生混乱,从而无法对信息进行有条理的处理,也无法区别出重要和次要的信息。随着商情数据库数量的增长和人类大脑接受处理信息能力的限制,商情数据库的利用率大大降低了,而目前可实现的提高数据库利用率的途径有三
35、种。421 数据可视化。通过改变数据库产品的类型来缓解人脑出现的视觉疲劳状态,以提高用户自身的信息处理能力是相对直接的一种方式。目前有关部门研究的数据可视化技术9即是提高人脑二次处理信息能力的一种方法。数据可视化技术可以在计算机屏幕上以图形或图像的方式形象地向用户显示各种数据, 使用户快速地理解和吸收数据所表示的信息, 以提高人类大脑二次处理信息的速度和能力。万方数据于2000年最新推出的“中国企业、公司及产品数据库”多媒体版就是商情数据库在数据可视化技术领域的有效尝试。422 数据库利用率分析。利用现有的信息技术,对数据库的利用进行一些统计分析,可以帮助用户对有用信息进行初步筛选。一般我们可
36、以通过对数据库用户、登录次数、检索次数、下载量、用户反馈信息等数据统计分析来评价一个数据库的利用率。这种方法的具体操作流程如下:首先,工作人员在数据库建立之初对数据库用户的资料进行分类,分别对不同的用户群建立动态档案。数据库用户指使用该数据库的主要用户群,通过了解使用此数据库的用户性质,可看其是否与该数据库的主要用户群相符,是否能满足该数据库大多数用户的信息需求。如果其用户偏向少数群体, 数据库就难以得到最大效益的使用。其次,对用户登录次数、数据的检索次数和下载次数以及用户反馈信息进行统计分析10。登录次数是用户打开一个数据库的次数。用户打开数据库的原因很多,不一定就是为了使用,因此这个数据无
37、法非常客观地反映其使用情况,只能作为一个基本的参数。检索次数是用户在一个数据库中提出检索式的次数。它的客观程度相对较大,次数越多说明数据库利用率越高。下载量是用户下载数据库文献的数量,它反映了用户使用该数据库文献资源的情况,下载量越大,说明该数据库资源满足用户信息需求的程度越高。用户反馈信息主要指用户使用后对数据库的总体评价,这些信息可用调查方式获得,由此判断该数据库的利用程度。最后,根据分析结果,对于不同的用户群,将其热门数据分别按检索下载次数的降序显示。这样不仅能提高用户检索信息的速度,还能提高查全率和查准率,在技术上也容易实施,是提高数据库利用率的一种简单有效的方法。423 开发便捷的检
38、索系统。庞大的数据库资源必须依靠良好的检索系统才能充分发挥其作用,因此数据库所提供的检索系统如何是影响数据库利用率的一个重要因素。对检索系统评价主要从以下几方面入手: 检索界面、检索功能、检索技术、检索结果、检索统计等10。表42 检索系统的评价指标评价指标主要内容详细说明评价标准检索界面用户界面检索界面是用户获取信息的需要向简单文本转化的中介一个良好的检索系统其用户界面应简洁明快,设计趋于人性化,用户易于掌握使用。除了主体的搜索栏以外,还可以加入用户检索或下载的数据记录。检索功能检索途径基本检索,字典检索,分类浏览,高级检索等系统除提供常用的检索途径和检索方式外,还应根据自身的特色提供特殊的
39、检索方式和入口,如EBSCO 数据库提供的工商企业名录检索( Company Directory) 、华尔街金融词典检索( Wallstreet Words) 等。总的来说,良好的检索系统应尽量满足多入口、多角度的检索要求。检索方式快速检索、传统检索、高级检索、分类检索等检索入口即能够链接进入该数据库的方式检索技术检索技巧布尔逻辑算符、截词符、通配符的运用;扩展、限制检索的运用等为了提高检索效率和查全率、查准率,检索技巧的使用必不可少。跨库检索即能够同时在多个数据库中进行检索的功能为了方便用户同时检索多个数据库,跨库检索功能应该具备。检索结果检索结果的处理功能结果的输出参数设置、排序方式、显示
40、方式、存取方式、全文浏览及下载方式等好的检索系统应为用户提供灵活多样的结果处理功能,如能设置每页的结果显示参数,有可供选择的多种排序、显示、存取及全文浏览、下载方式等,方便用户的使用。链接整合功能数据库系统是否提供与其他资源、服务之间的链接和整合灵活多样的链接整合功能将会大大方便用户对数据库的使用,也会大大增强数据库的优势。检索效果的评价查全率查全率用于衡量所需信息被检出的程度,用来表示系统能满足用户需求的完备程度。查全率的计算公式:查全率=输出的相关文献数/集合中相关文献总数100%11。在现代科技信息检索系统中,查全率一般达60%70%。查准率查准率是衡量检索系统拒绝非相关信息的能力。查准
41、率=输出的相关文献数/输出的文献总数100%11;在现代科技信息检索系统中,查准率一般达40%50%。查准率与查全率均是衡量检索系统和检索结果的重要标准。漏检率对于检索来说,漏检是影响检索质量的最主要因素,所以必须将漏检率降到最低。误检率误检会降低检索的效率,也会影响检索质量,所以应尽量避免误检。检索统计在本文422小节中已进行详细介绍,在此不作重复说明。目前我国商情数据库在检索界面和检索功能上与国外商情数据库的一般水平相差不大,但在检索技术(到现在为止我国商情数据库能实现跨库检索的还不多)和检索结果(尤其是链接整合能力)上仍存在很大差距。如果我国商情数据库的检索系统能在以上几个方面得到改进,
42、一定能在很大程度上提高数据库的利用效率。43增加载体类型,促进信息的服务与传播商情信息的服务载体有多种形式:如书本印刷、光盘出版、网络服务或缩微胶卷等。431印刷型数据库。在电子技术尚未发展起来的时候,数据库只能由书本印刷的形式储存和使用。随着电子技术的发展和信息的膨胀,传统印刷型的数据库更新慢、使用不便的缺陷已经难以适应时代发展的要求,所以光盘数据库诞生了,而印刷型数据库退而转为数据库储存的一种方式。432光盘数据库。因为光盘的成本低,制作费用小,光盘数据库技术上实现容易,对硬件系统的要求不高,在我国实现计算机检索的初期阶段起到了很重要的作用。尤其在互联网还没有普及的时期,光盘数据库成为了商
43、情数据库存在的主要形式之一。433网络数据库。光盘数据库有其局限性,它的规模和容量有限,在更新速度上也不能满足日新月异的科技发展的需求。互联网的出现,以全新的方式提供了一个更为强大的信息传播平台,通过互联网使用信息资源成为信息传播的主要方式之一。早期的联机检索和光盘局域网检索技术是实现网络数据库检索的基础,在技术条件具备和用户的需求下,网络数据库很快发展起来12。 和国外相比,我国的网络数据库发展尚有差距。国外的数字产品有数十年的发展历史,有相当规模的数据库生产商和数据服务商,在互联网发展之前,就有非常发达的商业化或非营利性的大型联机检索系统,这些使得国外的网络数据库一开始就有一个很高的起点。
44、相对而言,国内的网络数据库还在起始、摸索阶段,网络数据库产品数量虽然不算少,但大多数都是由光盘数据库直接转变而来,规模小,影响小,在网络中的分布也比较凌乱。434多种服务载体共存。虽然目前网络数据库已成为商情数据库的主导载体形式,但是在我国目前信息资源仍十分缺乏、计算机及网络的普及率尚没有达到十分优越的条件下,载体形式的多样化更有利于信息内容的服务与传播。美国数据库产业同一种信息内容一般可以同时提供印刷、光盘、网络三种载体,甚至还提供缩微胶卷。Gale公司1282种数据库产品中,印刷书本的种类只占48.2%。而我国目前商情信息服务方式比较单一,能同时提供印刷、光盘和网络三种载体服务的数据库屈指
45、可数,根本不提供缩微制品。一般来说,目前还保持更新的数据库都能提供网络服务载体形式,除此以外,能提供印刷和光盘的数据库就比较少了。具体比例如下表所示:表41 各类网站在线数据库其他载体形式(此数据来源于CNNIC)载体形式政府网站企业网站商业网站教育科研网站个人网站其他公益性网站光盘77.8%62.5%33.3%50.0%20.0%50.0%印刷44.4%62.5%66.7%100.0%60.0%66.7%其他11.1%20.8%40.0%33.3%普遍存在的现象是:提供光盘和网络服务的数据库不提供印刷版本;能提供印刷版本同时提供网络服务的数据库数量大于可同时出版光盘的数据库数量。要实现商情数
46、据库载体形式的多样化,在技术上并不困难,难的是提供多种载体形式需要更多的经费。所以在权衡多种服务载体的制作成本与使用价值之后,很多数据库生产商都放弃了多种载体形式的出版。本文4.4节中即将提到的实施数据库收费的政策将有效改善这一现状。44实施收费政策,实现数据库建设的可持续发展至2005年止,我国90以上的数据库还处于免费状态,具体情况如下图: 图4。1 2005年商情数据库的收费情况而事实上,免费政策并不利于商情数据库的发展。主要原因有两点:其一,目前我国商情数据库主要由政府信息机构承建,经费来源有限,信息来源也受到很多限制。因此,在建库的组织形式上应打破主要由政府部门承担的现状,提高商情数
47、据库的商业化水平,以多渠道融资方式解决数据库的资金问题,鼓励企业,甚至个人资金的加入,也就是对数据库的使用进行收费。这样企业既是建库者也是用户,用户需求更容易掌握,使商情数据库的建设真正通向用户,走向市场。其二,在信息爆炸的今天,由于各种技术手段的不完善,很多数据资源的获取和加工处理都依赖建库工作者手工完成。随着信息数量的日渐增多,为了保证工作的进度和质量,需要增加劳动资源或建立激励制度,这是一笔极大的数据库维护成本。而我国初期的商情数据库建设多依赖于政府,建库资金也由政府提供。面对日渐短缺的建库经费和日益增加的维护成本,对数据库的使用进行收费是解决资金来源最直接有效的方法。搜库科技公司总经理冯飞燕认为:真正带动互联网发展的,一定是那些有实用价值,能够解决生活、工作和学习问题的内容。而收费数据库的内容全部来自于行业内的权威机构并由专家整编,不仅可以帮助从业人员快速了解行业动态