信息采集系统.docx

上传人:太** 文档编号:86340627 上传时间:2023-04-14 格式:DOCX 页数:3 大小:10.97KB
返回 下载 相关 举报
信息采集系统.docx_第1页
第1页 / 共3页
信息采集系统.docx_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《信息采集系统.docx》由会员分享,可在线阅读,更多相关《信息采集系统.docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、中意信息采集系统.适用行业、软件用途:可用于多种行业的网站信息采集,包括新闻,商品信息,医疗,房产,企业,学校,党政等方面 的网站.新闻信息采集系统以网络信息挖掘引擎为基础构建而成,它可以在最短的时间内,帮您 把最新的新闻信息从不同的Internet站点上采集下来,并在进行分类和统一格式后,第一时 间之内把新闻的准时发布到自己的站点上去.从而提高信息准时性和节约或削减工作量.1 .功能介绍A信息猎取的范围可以采集一般的静态和动态网页信息,并自动将jpg , gif等图片内容采集到本地,同时 将网页中的图片链接自动转换成本地的图片链接.B.信息重复下载掌握通过对指定页面的位置、内容等条件的智能化

2、信息分析,有效防止信息的重复下载状 况,提高信息的猎取效率。C.完善的信息源配置用户可以自定义每个信息源的标示、起始地址、抓取信息地址格式、抓取信息类型、 抓取区域、关键字、启停时间、模版等参数,同时,系统还供应完善的信息源管理功能, 可便利的实现网站信息源的增、册U、改、查等操作。D.下载速度快多线程多信息源同时,下载用户可以同时启动多个线程进行高速信息页的下载。一般 的网络带宽,每秒可下载10-50个网页.E.开放性采集到的网页信息经过系统加工处理后统一存放为采集结果数据库中,便利定制开发 和与其它产品的集成;依据需要还可以把信息统一存放为xml文件。F.内容替换设置内容替换支持正则表达式

3、方式的替换,用户可以依据需要,去除网页中的广告,把不 合排版要求的内容转换成需要的格式.2 .技术特点A.新闻猎取准时响应可在短时间内(五分钟内),同时猎取分布于不同地域不同网站上的实时新闻,即时传递, 即时更新B.自动排重技术,有效筛选重复信息C.智能化猎取功能,全面有用简便D.定时启动定时停止E.可审核后发布,也可直接发布F.以往新闻检索G.采集的新闻内容可定制该系统可依据定制,有选择的在国内外主要的新闻网站收集有关的新闻。H.统一信息格式对采集到的不同来源、不同格式的新闻信息进行统一分类和保存。1 .可与现有信息系统集成该系统可便利的与现有的信息发布系统相集成,信息采集系统作为一个独立的模块运 行,不干涉原有系统的运行,集成涉及的仅仅是底层数据(不涉及数据结构).

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁