《水利部网站群信息统计分析系统购置及服务采购项目.doc》由会员分享,可在线阅读,更多相关《水利部网站群信息统计分析系统购置及服务采购项目.doc(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、水利部网站群信息统计分析系统购置及服务采购项目技术指标要求1总体要求要求投标商是中华人民共和国境内注册的独立法人,且至2009年12月31日止,连续经营3年(含)以上,提供企业法人营业执照复印件;具有软件企业认证证书;要求投标商是产品原厂商(或原厂家代理);具有相同产品、相当规模的同类项目的部委网站实施经验和成功案例(提供不少于2个二年内签署的类似合同案例);本次采购的软件产品需要具有自主知识产权,提供软件著作权登记证书复印件。要求项目实施完成时间为:2009年11月30日正式上线试运行。2主要实施内容建设网站群决策支持系统是为了对水利部网站群实施精确、高效的管理,保证网站质量优良、性能可靠、
2、内容准确、安全稳定、便于使用。该系统主要由以下几个部分构成:l 网站流量分析子系统l 网站质量诊断子系统l 实时排行系统l 分析报告(报告份数20份,其中月度分析报告12份、专题报告5份、流量异常报告3份)l 集成水利信息系统运行保障平台等现有系统l 实现与水利部CA的结合基于上述系统功能和评测数据、报告,及时掌握网站的最新情况,对重大问题进行排错、优化,确保网站实现高水平的运维;同时,系统支持按不同网站、部门的权限管理,使管理部门可实施按网站、部门进行精确的绩效考核。3.1网站流量分析子系统3.1.1、总体需求为网站管理者提供一个“多站点、多层次、多角色、多功能”的流量统计管理平台是水利部网
3、站流量分析子系统构建理念。它通过将平台内管理的各个对象点进行日志集中汇总、数据深度挖掘、信息统一发布,实现了网站群内部的信息和数据的共享,通过有效的信息整合、信息汇总,充分挖掘其中有价值的数据,从而提供决策依据。3.1.2、系统指标要求1. 数据准确性数据准确是水利部网站流量分析子系统的首要技术要求。2. 时效性系统在日志正常提供的情况下,全天的数据能够在次日提供。一天日志丢失补入后,更新数据不超过3小时自动完成。3. 数据采集系统能够同时在多台服务器上高速获取日志,系统的数据采集工作全自动完成,无需人工干涉。4. 系统结构系统支持跨平台运行。即支持在Linux、Windows等不同操作系统环
4、境下运行。5. 系统易用性系统在管理使用上简便、易用,有完善的管理界面对系统进行管理。6. 支持多种类型日志系统能对Web日志等多种格式日志进行全面分析,获取分析结果。Web日志支持IIS、Apache等格式日志。7. 数据可回溯性系统支持数据回溯,包括在日志延迟后能够进行及时补入,能够对包括站点、栏目、专题等数据自动回溯,保证数据完整准确,无需重新处理全部日志。8. 日志分析灵活性系统支持先获取日志先分析结果即可见机制。水利部网站日志来源众多,系统支持日志无序性处理,不必日志全部获取之后按照日期依次分析。在其中某一份或多份日志延迟几天获取时,无需重新分析全部日志,延迟日志在导入时无需人工干预
5、,实现系统的自动补入及数据动态更新。9. 数据发布与传输系统采用BS结构,管理员和访问者能够通过Web对系统进行远程管理和访问,数据在远程传输时采用加密传输。10. 展现结构系统分析结果采用多层次数据展现结构。11. 系统的扩展性系统可运行于64位操作系统及数据库环境,在使用过程中,处理能力、功能项目能够合理化扩展。3.1.3、功能要求1. 统计分析项目系统能够提供全面的分析项目,包含访问量、访客来源、访客行为等多方面对网站的访问情况进行全面分析,具体分析项目说明如下:a) 访问量:统计参数:页面浏览量(Page Views)、唯一访问者数(Unique Visitors) 访问次数(Visi
6、ts)、点击数(Hits)。b) 访客来源:统计参数:访客来源国家、省份、地区;访客来源站点或网址;访客来源搜索引擎c) 访客行为:统计参数:访客最先进入网页,访客最后退出网页d) 网页分析:统计参数:各个网页的访问量分析对象:通过统计各个网页的访问量分析网站各个页面的受众程度2. 检索功能 文章检索 通过输入某篇文章的地址,能够检索到该篇文章任意时间段内的页面浏览量。3. 栏目、专题全面分析功能系统能够对水利部门户网站及各层次栏目、二级栏目实现页面浏览量(Page Views)、唯一访问者数(Unique Visitors)、点击数(Hits)、访客来源、网页分析各项统计参数的详细分析。4.
7、 排行功能系统能够提供水利部网站各排行类分析结果,如下:a) 按照部门、栏目提供访问量类参数数据排行;b) 提供水利部各个频道专题、二级栏目访问量类参数数据排行;c) 提供搜索引擎排行;d) 提供搜索关键字排行;e) 提供国家、地区、省份受众程度排行;f) f. 提供来源网站或网址排名;g) 提供来源路径排名;5. 查询功能系统能够提供水利部网站流量分析系统的任何分析项目任意时间段(最小单位为天)的查询功能,同时主要功能的查询速度低于50秒。6. 数据输出功能系统数据结果能够以PDF、Excel、文本等格式进行数据输出。7. 界面友好要求系统查看界面及后台管理界面全中文显示,数据展示友好多样,
8、能够提供曲线图走势图、饼状图等多种数据表现。8. 数据备份与还原功能水利部网站流量分析系统具备数据备份与还原功能,在系统受到损坏时,能够通过备份文件迅速进行系统重建与数据还原。3.2网站质量诊断子系统3.2.1、总体需求建设网站质量诊断子系统是为了及时掌握水利部网站群无法访问、错链、断链等情况。该系统应能对所有监测页面进行高频度扫描(扫描频度可定制),用数字化指标对网站各方面的状态进行精确的测定和描述。在设计、开发时应确保系统安全稳定、内容准确,功能全面、可扩性强,界面美观、便于使用。3.2.2、系统指标要求1. 基本需求由于水利部网站的信息量很大,这就要求诊断和监控平台具有很强的性能和数据处
9、理能力。基本要求为:a) 对网站进行完整的诊断b) 具有较高的处理时效和吞吐量c) 可以多次检查并且保留历史数据d) 对网站的诊断不限深度e) 对网站的诊断不限页面数量f) 系统支持集群配置,并随着服务器数量的增加,处理性能线性增长2. 数据处理能力需求a) 页面扫描效率(单机指标):10,000页/小时b) 页面抓取数据的效率(单机指标):1G字节/小时c) 抓取数据入库的效率(单机指标):200,000条记录/小时d) 页面内容解析的准确程度:高于98%e) 页面内容解析的效率:高于1千字节/毫秒f) 页面错误定位的准确程度:高于98%g) 存储数据量:100,000条记录/次扫描h) 数
10、据处理时间:低于60秒/次扫描i) 数据查询时间:低于1秒/次扫描3. 数据访问能力需求a) 访问报表的速度:低于1秒b) 访问报表集合的速度:低于1秒c) 访问仪表板的速度:低于1秒3.2.3功能要求1. 网站资源诊断网站资源包括网页、各种图片、文档、音视频信息等,种类庞杂,且数量巨大,需要进行有效的管理。具体包括两个方面:资产的审计和盘点、资产的维护和更新a) 资源的审计和盘点应能对网站的资源进行全面审计和盘点,并提供各种资产的统计数据、详细清单,包括: 各类资源的总清单; 各类型按资源(如网页、图片、文档、音视频文件)的分类清单; 依赖各类型资源的页面清单; 各类资源的目录结构(包括各目
11、录下的资源列表)上述资源统计清单中均应提供相关资源数量、容量、数量占比、容量占比等。b) 资源维护的检查资源维护的检查能够反映网站的更新频度及相关问题。包括: 页面更新应可统计新页面、旧页面的数量、比例、更新或发布时间等。并应支持按时间段(如最新一周、最近一月、最近三个月、半年、一年以上)或按栏目、专题等定制条件进行更新检查。资源维护的绩效考核可按照栏目核定网站维护人员的绩效,如: 网站每个部门(每个人)负责的栏目总的页面有多少?总页面有多少? 每月(每周)的更新的总数是多少?比例如何?与前期相比,趋势如何? 每个栏目的发生错误的类型及数目如何? 与同期相比,改进趋势如何?要求可以按时间纵向考
12、核趋势;按栏目横向考核部门,得出发生问题的数量、比例和趋势信息。2. 内容缺陷诊断a) 断链检查研究表明,断链是网站流失访问用户的首要原因。断链严重影响用户的浏览情绪,导致用户转向别的站点。因此,断链诊断是最基础的需求。针对断链检查,要求提供如下功能: 采用Spider技术,遍历所有网页和链接,检查其可达性。可以从任意路径开始遍历,并支持对JavaScript、Flash等元素的扫描和解析; 多协议支持,至少支持如下协议:HTTP链接(http:和https:)、本地文件(file:),Mail链接(mailto:)、FTP链接(ftp:)、Gopher链接(gopher:)、Telnet链接
13、(telnet:)NNTP链接(news:snews,nntp);对上述链接,因为比较常见,所以检查时要进行实际连接,判断其正确性。还有一些不太常见的链接(如mms),系统可以进行识别,识别后作为警告提出,但不实际进行连接; 对每个链接,要求进行如下检查:(1) 语法检查:检查链接的语法是否正确;(2) 链接的可达性:即链接是否可以链接上;(3) 资源内部链接的检查:Text文档内部链接的检查;Flash内部链接的检查;PDF内部链接的检查;Word文档内部链接的检查;Excel文档内部链接的检查;PPT内部链接的检查。检查的错误类型应包括:禁止访问;连接错误;无法找到;错误请求;语法错误;服
14、务不可用 应提供对外部断链和内部断链进行分别统计,并给具体列表; 断链应明确给出断链URL、该断链影响到的页面的数量和具体URL列表,也可以按照页面URL查询该页面中存在的断链数量、列表等; 对发现的错误链接,应可在系统自动采集并保存的原始页面给出标注或定位。b) 敏感词汇检查敏感词汇包括国家法律所禁止的反动、黄色、低俗的词汇,同时也应支持由网站运营方定制的词汇。敏感词汇的检查应包括: 整站中包含的敏感词汇名称、数量、位置、影响页面列表等; 单个页面(如某些重要页面)中包含的敏感词汇名称、数量、位置等。3. 用户体验诊断用户体验直接关系到用户在浏览网站时的满意度。主要指标包括:a) 过大页面检
15、查容量过大的页面会导致过长的加载时间,引发用户放弃浏览,应尽量避免。系统应能提供如下功能: 支持自主设置“过大页面”的定义(如500K或其他); 提供过大页面的数量、页面容量统计,并提供详细列表(URL)及原始页面。b) 过深页面检查层级过深的页面会用户查找困难,引发放弃浏览和信息浪费,应尽量避免。系统应能提供如下功能: 支持自主设置“过深页面”的定义(如4级或其他); 提供过深页面的数量、页面深度统计,并提供详细路径、列表(URL)及原始页面。c) 页面跳转检查过多的页面跳转会影响用户的浏览体验,还可能造成用户流失到外站。页面跳转的检查应包括: 支持各种类型的页面跳转检查。如临时跳转、永久跳
16、转、meta跳转等; 提供各类跳转的数量、目标链接、父链接数等的统计和列表。4. 搜索引擎友好性诊断搜索引擎友好性指用户通过主要搜索引擎到达本网站的难易度,直接关系到网站自身的传播和推广能力。其中网站的相关元数据设置是影响搜索引擎友好性的关键和基础性指标。a) 页面标题检查系统应能自动检查网站中所有页面的标题设置情况,主要包括: 网站中缺失标题的页面数量、比例、列表; 网站中重复使用的页面标题数量、列表; 网站中使用重复标题的页面数量、比例、列表。b) 页面关键字检查页面关键字是否设置、设置的合理与否直接关系到页面可否被检索。具体检查项目: 网站中缺失关键字的页面数量、比例、列表; 重复使用的
17、关键字数量、列表; 使用重复关键字的页面数量、比例、列表。c) 页面描述检查页面描述与关键字类似,也是直接关系到页面可否被检索的重要元数据。具体检查项目: 网站中缺失描述的页面数量、比例、列表d) 替换文字检查页面元素(如图片等)是否设置替代文本,即直接关系到搜索引擎对网站内容的收录,也关系到用户在条件受限的情况下是否可以正常浏览网站。替换文本检查应包括: 网站中存在替换文本问题的页面数量、比例、列表; 按页面查看存在替换文本问题的元素、位置。e) 搜索引擎相关指标排名系统应可集中采集可反映网站搜索引擎友好性的部分通用第三方数据,包括: 网站的Alexa排名; 网站的Google PR值 网站
18、在Google、百度、Yahoo三个主流搜索引擎中的被收录条目; 网站在Google、百度、Yahoo三个主流搜索引擎中的反向链接数。5. 浏览器兼容性诊断系统应能检查网站中的页面、功能等是否兼容所有主流浏览器及不同的版本。至少应包含IE和Firefox。IE应该包含主流应用的版本,包括IE6.X、7.X,FireFox应该包含1.0以上的版本。检查的范围应该全面和深入,包括:a) 网站中存在的浏览器不兼容问题数量、问题类型、列表;b) 按浏览器分列的不兼容问题数量、问题类型、列表;c) 网站中存在浏览器不兼容问题的页面数量、比例、列表;d) 按页面查看其中的浏览器不兼容问题的数量、成因及说明
19、。6. W3C WCAG国际标准诊断系统应可检查网站与国际通用标准(W3C)中涉及用户体验的WCAG标准的符合度这一反映网站先进性的指标。主要包括:a) 网站中存在WCAG问题的页面数量、比例;b) 按WCAG规定的“优先级1的错误、优先级1的警告、优先级2的错误、优先级2的警告”分列出问题的数量、位置。3.3实时排行子系统3.3.1 总体需求水利部网站新闻排行子系统以网民访问情况为依据,通过实时访问统计数据为网民展现网站实时新闻排行情况,通过网站与网民的高效互动来实时更新网站新闻排行。3.3.2 系统性能指标1. 实时性通过网民实时返回的访问信息以及系统高效的处理速度实现新闻排行榜的及时性。
20、2. 可扩展性 对于网民访问高峰期或网站访问量不断增加的时候,可实现系统处理能力的扩充,而无需担心访问压力为新闻排行系统带来任何的影响。3. 可以提供多种排行展示方式4. 实时新闻排行榜与网站评论系统进行连接。3.3.3 功能要求1. 可以提供网站、栏目全面的新闻排行榜新闻排行榜要覆盖网站、栏目、专题各部分网站内容,实现全面的网站新闻排行,同时,水利部网站热点新闻排行榜与网站评论系统进行连接,网民在阅读新闻之后,可以随时发表对于新闻的看法、态度,为实现网站与网民的互动提供了一个通畅的通道。2. 即时新闻、天/周/月多时段新闻排行榜可以提供即时新闻排行、每日排行、每周排行等多种时间段排行形式。3
21、. 新闻任意回顾可以通过增加日历功能,提供选择查看历史新闻排行的功能。4. 稿件显示在排行榜中,将每一篇稿件的来源、发稿时间清晰的展示。3.4分析报告3.4.1总体需求流量分析报告是数据分析服务的主要成果物,是基于流量分析子系统所生成的数据按客户要求的格式和内容定期提交的报告,为水利部网站群发展决策提供依据。3.4.2质量要求1. 水利部网站群月度分析报告质量要求:a) 必须确保招标人要求统计的各项流量数据的准确无误;b) 能够用图形等多种较为直观的方式反映流量的增减变化趋势,并且能够用书面语言对流量的增减变化趋势和增减的主要原因给予准确的文字分析;c) 能够对访问者的来源进行地域方面和机构属
22、性方面的细分;d) 能够将工作日和非工作日分开来进行日均访问时段走势的数据统计和文字分析;e) 能够将访问者来源国家情况同日均访问时段结合起来进行数据统计和文字分析,以掌握各个时段全球对网站的访问情况;f) 能够准确区分网民直接访问的流量和由其他网站导入带来的流量,并且能够对带来流量的外站按搜索引擎类网站、水利部门户网站和其他网站进行细分和排序;g) 能够对门户网站前十位的热点信息、栏目、专题和调查进行数据统计和文字分析,从中分析出网民关注的热点问题;h) 提供网站群访问量自动排名功能,包括网站总访问量的自动排名、最受欢迎的栏目、最受欢迎的信息、最受欢迎的服务等的自动排名功能;i) 通过数据分
23、析,能够对网站群发展提出建设性的建议;j) 能为网站群提供跨站点分析报告;k) 报告必须严格按照甲方要求的时间及时提供。2. 水利部专题分析报告质量要求:a) 必须确保招标人要求统计的各项流量数据的准确无误;b) 能够用图形等多种较为直观的方式反映专题流量的增减变化趋势,并且能够用书面语言对专题流量的增减变化趋势和增减的主要原因给予准确的文字分析;c) 能够对专题访问者的来源进行地域方面和机构属性方面的细分;d) 能够将专题访问者来源国家情况同日均访问时段结合起来进行数据统计和文字分析,以掌握各个时段全球对网站的访问情况;e) 通过数据分析,能够对网站群发展提出建设性的建议;f) 提供专题访问
24、量自动排名功能,包括专题总访问量的自动排名、最受欢迎的子栏目、最受欢迎的信息、最受欢迎的服务等的自动排名功能;g) 报告必须严格按照甲方要求的时间及时提供。3. 水利部异常分析报告质量要求:a) 要主动给分析流量异常现象,并作深入分析;b) 必须去报甲方要求统计的各项流量数据的准确无误;c) 能够用图形等多种较为直观的方式反映流量异常情况的增减变化趋势,要求和正常时期的流量情况进行对比,并且能够对流量异常情况的增减变化趋势、较正常时期的对比结果和出现异常情况的主要原因给予准确的分析;d) 能够对访问者的IP地址进行分析,明确异常访问的IP地址所属网段(要求对北京地区的IP地址明确到大的使用单位,外地要明确到运营商),判断是否属于恶意攻击,是否存在安全隐患;e) 通过对流量异常情况分析得出结论向甲方提出相关建议;f) 报告必须按甲方要求及时提供。3.5 其他l 实现与水利信息系统运行保障平台、水利部CA等系统的二次集成l 产品部署要求项目描述产品名称网站群信息访问流量统计分析及健康诊断分析等系统产品(系统)形态软件支持子站数量不限操作系统支持Windows、Linux和Unix支持Web服务器支持IIS、Apache、J2EE(Weblogic/Websphere)