《数据挖掘在物流领域的应用(共6页).doc》由会员分享,可在线阅读,更多相关《数据挖掘在物流领域的应用(共6页).doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上本文来源于网络综述数据挖掘技术在物流领域中的应用2007级物流工程一班0欧阳家文专心-专注-专业摘要:本文主要内容是综述数据挖掘技术在物流领域中的应用。文章首先对数据挖掘技术做一个简单的介绍,接着介绍数据挖掘在物流业中的应用过程,最后介绍物流中关于数据挖掘应用的管理问题。 关键词:数据挖掘 数据仓库 物流领域应用1,应用背景物流是现代商品流通系统的重要组成部分,物流业的发展程度,反映了一个国家和地区经济的综合配套能力与社会化服务程度,是其经济发展水平的集中体现。作为继劳动力和自然资源之后的“第三利润源泉”,现代物流产业的发展已经成为拉动我国经济发展的新增长点。与此同时
2、,现代物流系统是一个庞大复杂的系统,特别是全程物流、包括运输、仓储,配送、搬运、包装和再加工等环节,每个环节的信息量非常大,使企业很难对这些数据进行有条理,有选择性的分析。如何将企业中积累的大量的原始客户数据转化成有用的信息为决策者提供决策支持,已经成为数据库研究中一个很有应用价值的新领域,数据挖掘技术由此应运而生。数据挖掘技术能帮助企业在物流信息管理系统中,及时、准确地搜集数据并对其进行分析。对客户的行为及市场趋势进行有效的分析,了解不同客户的爱好,从而为客户提供有针对性的产品和服务。提升企业的客户满意度,对公司的长远发展有着极大的促进作用。2,什么是数据挖掘技术?数据挖掘技术是利用人工智能
3、(AI)和统计分析等技术,在海量数据中发现模型和数据间的关系,自动地帮助决策者分析历史数据和当前的数据,并做出归纳性的推理,从中挖掘出潜在的模式,从而预测客户的行为,帮助企业的决策者调整市场策略、减少风险、做出正确的决策。结合现代物流的特质和外部环境考虑,数据挖掘技术能够提供越来越强大的支持功能。从商业的角度考虑,由于在商业行为中存在着大量的信息,而这些信息并不是都是所需要的,也就是,它是有噪声的,模糊的,随机的数据,必须通过某种技术对这些隐含在其中的,人们不知道的,但又是潜在有用的信息和只是的过程。只有通过类似于数据挖掘的这样的技术对商业数据库进行抽取,转换,分析等操作,才可以让这些埋藏着的
4、金子发光发亮。3,数据挖掘技术的特点数据挖掘技术具有以下特点:( 1) 处理的数据规模十分庞大, 达到GB、TB 数据级, 甚至更大。( 2) 查询一般是决策制定者提出的即时随机查询, 往往不能形成精确的查询要求, 需要靠系统本身寻找其可能感兴趣的东西。( 3) 在一些应用中( 如商业投资等) , 由于数据变化迅速,因此要求数据挖掘能快速做出相应反应以随时提供决策支持。( 4) 数据挖掘中, 规则的发现基于统计规律。因此, 所发现的规则不必适用于所有数据, 而是当达到某一临界值即认为有效。因此, 利用数据挖掘技术可能会发现大量的规则。( 5) 数据挖掘所发现的规则是动态的, 它只找到了当前状态
5、的数据库具有的规则, 随着不断地向数据库中加入新数据,需要随时对其进行更新。4,数据挖掘的一般过程数据挖掘过程可以大体分为四个步骤:数据准备,数据挖掘,结果的解释和评价,用户界面。如图1:图1 数据挖掘一般过程步骤1:数据准备。(1) 数据选择。搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘的应用的数据。以物流领域中的仓库管理为例,仓库管理中通常会对货物进行一定的分类,从而来有效利用平面,空间利用率,同时让工作流程更加的高效。在物流上,通常取用ABC分类法(即按货物的价值与数量)进行分类。而这些数据多从市场上搜集得来,部分是直接从零售商处取得的。在这种情况下,数据选择应
6、选择那些跟市场销售上有更多关联的数据。(2) 数据的预处理。研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。仍以上述例子说明,通过各类市场搜集回来的各种数据中存在有很多的噪音,例如由于某些特别的原因,导致某产品在特定的短时期内价格有所上升,偏离平时情况。数据预处理则是要先对这样的偏离的数据预先剔走。(3) 数据的转换。将数据转换成一个分析模型。这个分析模型是针对挖掘算法建成的,建立一个真正的适合挖掘算法的分析模型是数据挖掘成功的关键。步骤2:数据挖掘。对所得到的经过转换的数据进行挖掘,除了进一步完善挖掘算法外,其余一切工作都能自动完成。以下一些情况可能影响数据挖掘的效果。
7、以上述例子为例如:出现填写错误的订单;部分重复的订单数据;缺少相应可以实施的功能;挖掘出来的的结果缺乏充分的理由;耗时太长等。步骤3:结果的解释和评价。解释并评估结果,其使用的分析方法一般应视不同的数据挖掘操作而定。根据最终用户的决策目的对提取的信息进行分析,把最有价值的信息区分出来,并且通过决策支持工具提交给决策者。因此这一步骤的任务不仅是把结果表达出来。还要对信息进行过滤处理,如果不能令决策者满意,需要重复以上数据挖掘过程。步骤4:用户界面。 将分析所得到的知识集成到业务信息系统组织结构中去。5,物流领域中的数据挖掘过程(1)定义商业问题。每一个客户关系管理应用程序都有一个或多个商业目标,
8、为此需要建立恰当的有针对性的模型。在数据挖掘之前,应从企业角度分析要达到的需求和目标,将物流目标转换成数据挖掘目标,给出数据挖掘问题的定义,并设计一个达到目标的初步计划。 (2)建立行销数据库。因为操作性数据库和共同的数据仓库常常没有提供所需格式的数据,因此需要建立一个行销数据库。建立行销数据库时,要对它进行净化。因为需要的数据可能在不同的数据库中,所以需要集成和合并数据到单一的行销数据库中,并协调来自多个数据源的数据在数值上的差异。 (3)为建模准备数据。根据已确定的挖掘目标,选择挖掘的数据源,一般包括企业客户数据库、业务数据库、外部数据库,对取得的各种数据源进行预处理,检查数据的完整性和一
9、致性。 (4)数据挖掘模型的构建。模型建立是一个迭代的过程,需要研究可供选择的模型,从中找出最能解决企业商业问题的一个。根据确定的挖掘目标,选择适合的挖掘模型和挖掘算法,对数据挖掘库中数据进行处理,对模型的参数进行调整,可综合运用几种挖掘模型,然后再对结果进行分析。 (5)模型评估。要及时对建立的模型进行解释和评估。企业的客户关系管理人员根据挖掘的结果和先确立的挖掘目标进行解释和评价,过滤出要呈现给用户的知识,并将有意义的知识以图形或逻辑可视化的形式表现出来,易于让用户理解。如果跟挖掘目标有出入,需要重新对数据建模、改进和完善。 (6)将数据挖掘运用到客户关系管理方案中。在建立客户关系管理应用
10、时,数据挖掘常常是整个产品中很小的但意义重大的一部分。通过数据挖掘而得出的预测模式可以和各个领域的专家知识结合在一起,构成一个可供不同类型的人使用的应用程序。我国物流企业现阶段总体上还处于向现代物流转型的时期,在客户关系管理方面,虽然企业对客户十分关注,并积累了一定的客户信息,但仍然存在着许多问题。虽然客户关系管理逐步得到应用,但在客户关系管理中积累下来的海量数据并没有得到企业决策层的足够的认识,尚未完全挖掘出这些数据中蕴藏的有用信息。客户关系管理以其先进理念,为提高企业核心竞争力创造了条件,数据挖掘以其强大的数据分析能力,为切实落实物流企业的客户管理计划提供了可能。随着经济的不断发展,数据挖
11、掘技术与物流企业客户关系管理的结合,将为物流企业客户关系管理带来更好的应用前景和市场价值。基于数据仓库与数据挖掘技术的现代物流体系可由采购进货管理系统、销货出货管理系统、库存仓储管理系统、财务管理和结算系统、物流客户管理系统、OLAP、数据仓库、数据挖掘处理的物流分析系统、解释评价系统、运输配送管理系统、物流决策支持等系统组成。 在采购进货、销货出货、财务管理和结算系统中,利用数据仓库和数据挖掘技术,可以改善物流业务与资金的平衡、提高资金的周转,结合物流客户管理系统,以确保把握住利润最高的商品品种、数量和可靠的物流客户,发展良好的客户关系。库存仓储管理中利用数据仓库和数据挖掘技术,可以合理安排
12、货品的存储,有效的提高拣货效率,动态把握货品流通,最大限度实现“零库存”,降低企业成本,提高企业效益。运输配送管理系统中,应用GIS 技术与运筹决策模型建立的物流分析系统,通过数据挖掘中的分类树的方法,确定配送中心点的位置及各地址间的物品运输量,编制配送计划,设计和优化配送路线,确定有效配送策略,并结合物流决策支持系统中,分析内外各种信息、图表。运用数据挖掘工具对历史数据进行多角度、立体的分析,建立决策支持系统,实现对物流中心的资源的综合管理,为物流决策提供科学的依据。如图2:图2 物流业中数据挖掘一般过程设想由上图可见,我们将现代物流系统按功能的不同简单分成了5个系统:分别是采购进货系统,进
13、出货系统,库存仓储系统,财务结算系统,物流客户服务系统。我们分别对这5个系统建立自己的数据库,数据库的数据要根据各个系统的特征进行建立。在挖掘过程中,建立了物流分析系统,系统将跟据不同的计算原则采用不同的挖掘算法对各个数据库进行数据挖掘,以其得出理想的数据。最后将对数据进行解释和评价,归纳总结后用于支持决策的制定。6,现代物流中如何应用数据挖掘(1)目前的挑战。在我国现代物流是一个新兴的行业。一个关键的问题是虽然伴随着国外物流管理成功经验的传入很多企业或者专门提供物流服务的3PL和4PL都意识到了数据挖掘在这个新兴行业中应用的必然趋势和广阔前景,但因现代物流的涵盖之广,如何把数据挖掘应用在其中
14、,发现各方面有意义的知识以供领导决策,仍然是个令多方人士困惑的问题。(2)以活动为基础现代物流剖析。数据挖掘是基于数据库和/或数据仓库而进行的,而数据库是基于企业各方面的底层经营资料搭建而成的。数据仓库的组织是面向主题的。现代物流则是一个过程,包含了计划、实施和控制的功能,提供了各种各样的服务。 那么,如何将二者结合起来,使数据挖掘技术全面地支撑起其在现代物流中的应用呢?资料介绍有一种解决方法。基于活动的现代物流剖析ABP(Active Based Paunching),我们注意到,把现代物流按照其经营活动进行剖析。进而继续细分可以逐渐渗透到企业的底层经营中去,即把物流活动的分析同日常的经营联
15、系起来,从而在现代物流和数据挖掘之间搭建起一座相互沟通的桥梁,这样数据挖掘就可以在现代物流的各个方面都可以得到应用。依据这种理念,现代物流管理在第一次的剖析中,可以认为包含以下五个相互依赖的活动:客户反应、库存计划与管理、供应、运输和仓储。 接下来,基于这五种活动进行第二次剖析,即(1)客户活动剖析;(2)库存活动剖析;(3)供应活动剖析;(4)运输活动剖析;(5)仓储活动剖析。数据挖掘技术源于物流的直接需求, 虽然它在各种领域都存在广泛的使用价值, 但是物流领域是数据挖掘的主要应用领域之一。这是因为条形码等技术的发展, 物流部门可以利用前端PC 系统收集、存储大量的进出历史记录、货物进出状况
16、和服务记录等数据。物流业同其数据密集型企业一样积累了大量的数据,。这些数据正是数据挖掘的基础。数据挖掘技术有助于识别运输行为,发现配送新模式和趋势,改进运输效率,取得更高的核心竞争力,减少物流成本。同时,我国物流企业己经开始摆脱简单的技术应用阶段,已经从单纯的应用数据库系统和简单MIS 发展到应用智能决策系统。从传统管理提高到依靠企业市场竞争力的战略角度来实施物流业信息化。然而,在这一过程中,最缺乏的就是对数据的有效利用,即缺乏对数据进行深层次的分析,然后应用分析结果于经营活动中去。数据如果不进行分析, 它就只是一种简单的原始数据, 不能生成可供企业分析、决策的信息。宏观的来说,数据挖掘可以从
17、下面几个方面将各类物流活动进行剖析和相互联系:(1)纵览全局, 提高物流决策的总体效率。通过分类信息(按货物的种类、数量、地点和日期等)了解每天的运营和财政情况, 掌控每一货物的运输成本和库存的变化。在运输货物时, 随时检查货物运输结构是否合理, 这一点十分重要。(2)降低库存成本。通过数据挖掘系统,将运输数据和库存数据集中起来,通过数据分析, 决定对哪些货物进行先行发货,以确保合适的库存。数据挖掘系统还可以将库存信息和货物预测信息通过电子数据交换( EDI) 系统直接送到客户那里,这样可以定期增加或者减少库存, 进而减少自身的负担。(3) 货物分组布局、运输推荐参照分析。通过从统计记录中挖掘
18、的有关信息,可以发现运输某一种货物的顾客可能运输其他货物。这类信息,可以形成固定的运输推荐,或者保持一定的组合( 货物分组布局),以帮助客户方便的发送货物,打动顾客的心,从而增加营业额。(4) 市场和趋势分析。利用数据挖掘工具和统计模型对数据库的数据仔细研究,以分析客户的运输习惯和其它战略性信息。通过检索数据库中近年来的物流数据,运用数据挖掘,可以对货物的季节性、运输量、品种和库存等的趋势进行数据挖掘分析,从而可确定风险货物,对物流运作管理做出决策。(5)客户细分。客户细分是将人的消费群体划分为若干小细分群体,同属一个细分群的消费者彼此相似。客户细分可以使商家以不同的方法区别对待处于不同细分群
19、中的客户, 但这并不意味着服务与质量上的差别。(6)交叉盈利。物流企业和客户之间的关系是一种持续不断的发展关系, 交叉盈利是建立在业务双方互利原则的基础之上的。客户因得到更多、更好的符合他们需求的服务而获益, 企业也因业务增长而获益。在很多情况下对老客户状况的数据挖掘与对新客户的数据挖掘是一致的。交叉盈利的优势在于, 企业可以比较容易地得到关于老客户的比较丰富的信息, 大量的数据可以保证数据挖掘的准确性。7 ,运用数据挖掘技术时应注意的问题首先应该注意的是,在物流决策过程中,不是所有的数据挖掘系统都能解决物流领域上的问题的。如果不能将特殊领域的物流业逻辑与数据挖掘技术集成起来,数据挖掘的分析效
20、果和效益就不可能达到最佳值。总的说来,决策者在应用数据挖掘技术时, 应该考虑两方面的因素: 一是用数据挖掘“发现”问题;二是用数据挖掘“发明”解决问题的方法。“发现”就是从数据中寻找规律, 从物流业运作过程产生的大量业务数据中寻找出聚类性质的相互关系, 以获得有价值的物流业信息。“发明”就是以数据规律为基础, 通过利用某些数学方法( 如统计分析和人工智能等) 将实际问题抽象为数学模型, 以指导解决实际问题。具体来说, 应该注意以下几个方面的问题:( 1) 避免重复投资。数据挖掘是从大量数据中提取有价值的信息,而数据一般存储在数据库中。物流业进行信息化建设的前期一般己经选用了一种数据库产品,因此
21、要首先考虑数据库更新的问题以及数据挖掘系统与物流其他系统的集成问题。这样,才能有利于企业降低成木, 达到最大效益并且保护已有的投资。( 2) 技术人员及其素质。数据挖掘人员首先要有良好的统计概念,其次要懂得基本的物流和行业概念,他们所选用的技术和优化方法会对模型的准确度和生成速度产生很大影响。物流业中一般不具备上述人才, 物流决策者应该重视引进并保留住合格的人才。( 3) 数据挖掘的工具选择。目前的数据挖掘工具大多是国外的舶来品,是否适合我国物流业的特点还有待于实践的检验,但在国内数据挖掘工具还不成熟的情况下,只有选择合适的国外产品。引进这些外国产品的时候要考虑定制问题,只有适合并能正确反映企
22、业具体经营状况的工具才是首选工具。( 4) 数据质量。国内很多大的物流公司和企业都建立起了自己的业务系统,同时伴随着一个比较庞大的数据中心。但这种面向事务而产生的数据在质量、完整性和一致性上都存在着很多问题,这就使得数据挖掘应用专家很难集中精神去建立模型,而是投入太多的精力和时间去解决数据的抽取、净化和处理。( 5) 数据的准备。为了保证数据挖掘结果的价值,必须了解数据,这一点至关重要。输入数据库中的异常数据、不相关的字段或互相冲突的字段、数据的编码方式等都会对数据挖掘输出结果的质量产生影响。虽然一些数据挖掘算法自身会对上面提到的问题做一些考虑,但让算法自己做所有这些决定是不明智的。在进行数据
23、挖掘前, 要对以前的经营数据进行必要的“整理”与“筛选”, 以提高数据挖掘的效率与正确性。参考文献:1, RonddH B4UoM,王晓东.企业物流管理供应链的规划、组织和控制.北京:机械工业出版,20022, 王珊,数据仓库技术和联机分析处理.北京:科学出版社,19993, R 格罗斯,侯迪,宋擒豹.数据挖掘构筑企业竞争优势.西安交通大学出版社,20014, 刘中.基于数据挖掘技术在物流决策系统中的应用J电脑开发与应用5, 曹敏.数据挖掘在物流管理决策中的应用 20076, 杨勇刚.数据挖掘在物流领域中的应用 20067, Jiawei Han范明,孟小峰译:数据挖掘概念与技术 20018, 王长浩 基于数据挖掘技术的物流体系9, 刘晓华 数据挖掘在物流业中的应用10, QIAN Ying Logistics Network of Customer Relationship Management11, R.Glenn,S.Kent .The Nul l Encryption Algorithm and Its Use with IPSec J.RFC2410,1998,11.12,陈安,陈宁,周龙骧,等.数据挖掘技术及应用M.北京:科学出版社,2006.13,阎子刚.物流信息技术M.北京:高等教育出版社,2003.