《数据挖掘在电子商务中的应用-精品文档.docx》由会员分享,可在线阅读,更多相关《数据挖掘在电子商务中的应用-精品文档.docx(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据挖掘在电子商务中的应用摘要:大数据时代迅速增长的商业数据和信息之间的内在联络,备受电子商务经营者的普遍关注。本文基于商业数据和信息之间的关联,较深化地讨论了Web数据挖掘技术相关理论及其在电子商务中的详细应用。关键词:数据抽取;聚类分析;Web数据挖掘技术1数据挖掘的渊源日常生活中时常会出现如下情况,商场经营者总期望销售量较大的商品放在同一区域以便于提高销售额;银行想了解具有何种特征的客户需要申请购房贷款;保险公司精算师期望在诸多病历中寻找到患某种疾病患者的同类特征,进而提高设计理赔条款的最合理性。针对上述问题,采用传统数据分析工具难以到达实际需求。由于传统信息管理系统采用的数据库系统还是
2、只要简单处理数据功能,以实现对报表的查询统计,而无法提取数据中蕴含内在的深层关系。随着不断增加的信息量及广泛应用的信息管理系统,更期望其具有更丰富的数据分析功能,进而提供出科学决策。基于该需求,有利地促进了Web数据挖掘技术的迅速发展。数据挖掘主要是指将隐藏在大量数据中的有用信息提取出来,在大型数据库中应用机器学习的综合信息处理技术。它将各学科技术的信息处理方法进行综合,主要有分类、聚类、关联规则、预测及检测偏差等功能。2数据挖掘方法和模型数据挖掘作为新兴技术,在处理数据方面具有的特征特别明显。数据挖掘主要用于海量数据,也是其产生的一个重要原因。数据一般都是不完全的,数据构造比拟复杂,也具有较
3、大维数。数据挖掘穿插了很多学科,采用信息、统计、数学等多个学科技术,在实际中最为常见和广泛应用的有传通通计方法、可视化技术、决策树、神经网络、遗传算法及关联规则挖掘算法六种算法和模型。3国内外Web数据挖掘技术的研究现状及发展趋势随着知识发现的影响日益增大,1995年国际知识发现组委会将专题讨论会改为国际会议,并在加拿大召开世界第一届知识发现国际学术会议,并构成年度国际会议。近年来,在知识发现方面开展了很多行之有效的研究工作并得到快速发展,十分是应用于商业和银行领域尤为迅速。国外在数据挖掘方面比拟关注于贝叶斯方法及Boosting方法的研究,在知识发现中应用传统的统计学回归法,并严密结合数据库
4、。研发完成了很多知识发现软件工具并日益完善,加强用于解决问题的整体系统的研发,而经过并非孤立。国内主要是高校、科研机构等研究人员开展Web数据挖掘技术的研究,主要开展学习算法、数据挖掘相关理论及技术应用等很多方面的研究,国家也在自然基金、863计划等对相关研究提供赞助经费。有关统计数据显示,知识发现及人工智能等技术是将来对工业具有较重要影响的关键技术。充分讲明数据挖掘的研究和应用备受社会关注,并已成为一个研究热门。4Web数据挖掘技术在电子商务中的应用在电子商务活动中主要是将客户作为Web数据挖掘技术的研究对象,进而发现客户具有个性和共性、必然和偶尔、独立和关联及现实和预测等方面的知识。上述知
5、识都可发现处于不同概念层次,从微观分析到宏观,客观分析统计客户的消费行为,为提高电子商务管理水平提供重要决策,以充分知足各类客户实际需求。4.1应用于电子商务的分类与预测分类技术在电子商务中应用最多,也是电子商务中很重要的一项任务。主要用于采用统计、机器学习及神经网络等方法构造分类器,将数据库中数据项向给定某类别中的一个进行映射,以利于预测将来数据。4.2应用于电子商务中的聚类分析聚类就是根据类似性原则将一组个体归为多个不同类别,在电子商务中主要采用客户聚类实现对市场不同消费群体的细分。使同类别个体之间只要最小距离,而不同类别个体之间具有较大距离,利于提取聚类客户特征,电子商务网站可采用统计、
6、机器学习及神经网络等方法为客户提供个性化服务。4.3应用于电子商务中的数据抽取相对于传统商务活动,电子商务具有诸如客户购买动机、心理、欲望及能力等很多虚拟和不确定因素,采用何种方法在无规则的零散数据中寻找到具有价值和规则的数据是数据挖掘的主要任务。数据抽取就是其中的一个基本方法,主要是浓缩数据,采用平均、求和及方差等统计值或直方、饼状等图形方式给出数据抽取的紧凑描绘,最重要的是基于数据泛化对数据总结进行讨论。数据泛化是将低层次的原始、基本的信息数据向高层次进行抽象的一个经过,在电子商务活动中,数据抽取通常采用多维数据分析方法,对客户数据仓库中的数据进行分析,以用于决策支持系统。4.4应用于电子
7、商务中的关联规则事务型数据库是用于关联规则对主要对象进行发现。一个事务通常由处理时间、顾客标识及所购物品构成,因条形码及Web技术的日益成熟,管理部门能够将存储的客户资料与售货数据进行收集,对其分析后并发现关联规则,根据网购客户的购买行为提供具有价值的信息。可用于对市场进行规划,对商品种类、价格等进行确定。关联规则一般分为有意义关联规则和泛化关联规则,前者主要是指对最小支持度和可信度提供界线的规则;后者对最小可信度提供界线,使最低可靠度在关联规则上得到反响。泛化关联规则更具有实用性,由于研究对象之间具有层次关系,对于更多有意义规则的发现更具有辅助意义。5结语综上所述,当代信息技术有力促进了电子
8、商务的发展,也在商业运作形式中不可或缺。基于全球经济一体化,应对网络基础设施继续加强建设,推进企业电子商务化进程,在电子商务方面健全安全立法并建设愈加完善的物流配送体系,使电子商务具有良好的发展环境。并在文本、多媒体及网络等方面深化Web数据挖掘技术研究,使存在于电子商务中的数据安全保密、数据质量及集成其它商业软件等问题得到妥善解决。充分利用数据挖掘等技术,使企业优势得到充分发挥,加快技术与管理创新,才能促进使企业在电子商务中的有序发展。参考文献 1李业丽.神经网络在数据挖掘中的应用研究J.计算机工程与应用,201310. 2陈国萍,李巍,刘仲英.数据挖掘中概念树的标准、生成和实现J,计算机工程,201208.