《电子商务中的商务智能ppt课件.ppt》由会员分享,可在线阅读,更多相关《电子商务中的商务智能ppt课件.ppt(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、电子商务中的商务智能本章学习目标:本章学习目标:电子商务数据环境的特殊性;电子商务数据环境的特殊性;Web数据的各种分析;数据的各种分析;电子商务数据仓库的逻辑模型设计;电子商务数据仓库的逻辑模型设计;电子商务数据仓库的电子商务数据仓库的ETL系统设计方法;系统设计方法;数据挖掘在电子商务中的应用;数据挖掘在电子商务中的应用;电子商务中的商务智能 7.1 电子商务的数据仓库开发电子商务的数据仓库开发7.2 电子商务数据仓库的逻辑模型电子商务数据仓库的逻辑模型7.3 电子商务数据仓库的电子商务数据仓库的ETL设计设计7.4 电子商务数据挖掘电子商务数据挖掘7.1 电子商务的数据仓库开发电子商务的
2、数据仓库开发7.1.1 电子商务的数据环境分析电子商务的数据环境分析点点击击流流数数据据、E-mail、IP地地址址、交交易易记记录录、安安全全检检查查、电子金融数据电子金融数据 1电子商务数据环境电子商务数据环境Web服服务务器器日日志志(WebServer Logs)、Cookie信信息息、广广告告服服务务 器器 数数 据据 库库(Ad Server Database)、注注 册册 数数 据据 库库(Registration Database)、商商业业应应用用数数据据库库(Commerce Application Database)。)。2Web服务器日志服务器日志通通用用日日志志格格式
3、式(CLF,Common Log Format)和和扩扩展展通通用用日日志志格格式式(ECLF,Extended Common Log Format)通用日志格式文件中主要包含七种元素:主机、识别、审核、时间、请求、状态和字节数。扩展通用日志格式文件除七种元素外,还增加了引用站点和用户代理两个元素。在服务器的日志文件中还包含文件名、服务时间、IP地址、服务器端口、进程ID、格式化时间、被请求的URL、服务器名称和Cookie等信息。与电子商务直接有关的后台应用程序数据库中的商品销售数据、商品发送数据、商品库存数据、客户基本信息等商务活动数据源也是智能型电子商务数据仓库的主要数据来源。7.1.2
4、 电子商务数据仓库项目规划电子商务数据仓库项目规划首先需要定义项目的商业目标。要用智能型电子商务的商务词汇表示。即用“提高网站商品销售量”、“提高电子商务销售利润”、“提高网络促销策略响应率”来表示商务智能的最终目标。7.1.3 电子商务数据仓库需求分析电子商务数据仓库需求分析 需求分析是电子商务数据仓库设计的基础 了解在电子商务网站中可以用哪些数据来满足最终用户的决策要求。主要目标有:基于对需求和能满足的或不能满足的终端用户需求数据有更详尽的了解,重新定义项目的规模;确定项目开发的优先次序,对项目的规模、预算和时间安排基于这些优先次序做必要的调整;为了支持用户的决策信息需求,将网站上的任何变
5、更用文挡的形式记录下来;创建一个描述关键性机遇的领域、分析信息需求以及数据来源的商务智能需求文挡,为项目今后阶段的工作制定详细工作计划。7.1.4 电子商务数据仓库逻辑模型设计电子商务数据仓库逻辑模型设计1.数据仓库的逻辑模型设计数据仓库的逻辑模型设计2.智能型电子商务应用开发智能型电子商务应用开发3.逻辑模型文档设计逻辑模型文档设计 7.1.5 电子商务数据仓库物理模型设计电子商务数据仓库物理模型设计电子商务数据仓库的结构和基础开发电子商务数据仓库的结构和基础开发电子商务数据仓库的物理模型设计电子商务数据仓库的物理模型设计电子商务数据仓库的应用开发电子商务数据仓库的应用开发电子商务数据仓库的
6、系统集成电子商务数据仓库的系统集成7.1.6 电子商务数据仓库实现与部署电子商务数据仓库实现与部署 7.2 电子商务数据仓库的逻辑模型电子商务数据仓库的逻辑模型7.2.1 营销的数据仓库模型演变营销的数据仓库模型演变销售事实产品促销地理位置时间7.2 电子商务数据仓库的逻辑模型电子商务数据仓库的逻辑模型7.2.1 营销的数据仓库模型演变营销的数据仓库模型演变用户活动/站点点击事实内容内部促销物理地理财政时间用户用户时间站点地理Web地理活动外部促销7.2.2 客户维客户维用户维用户维用用户户身身份份信信息息是是用用户户的的代代理理信信息息。可可以以分分成成两两种种属属性性,即即用用户户代代理理
7、类类型型和和用用户户代代理理名名字字。其其中中,用用户户代代理理类类型型主主要要用用来来区区分分一一次次相相应应的的网网页页点点击击是是真真实实用用户户行行为为还还是是索索引引机机器器人人的的行行为为。用用户户代代理理名名字字属属性性给给出出用用户户浏浏览览器器或或者者索索引引机机器器人的名字以及版本号。人的名字以及版本号。用用户户维维可可以以包包括括这这样样一一些些属属性性:用用户户标标识识符符、用用户户代代理理类类型型、用用户户代代理理名名、用用户户类类型型、性性别别、注注册册用用户户名名、电电子子邮邮件件地地址址、消消费费人人群群、人人口口统统计计信信息息、最最后后购购买买时时间间戳戳、
8、信信用用概概要、电话号码和地址等。要、电话号码和地址等。用用户户维维的的属属性性是是可可选选的的。用用户户类类型型和和性性别别可可以以在在会会话话过过程程或或者者用用户户注注册册信信息息中中获获取取。消消费费人人群群和和人人口口统统计计信信息息由由许许多多描描述述用用户户的的字字段段组组成成,这这些些信信息息也也可可能能来来自自第第三三方方的的市市场场调调查查公公司司。如如果果站站点点支支持持在在线线购购物物,那那么么用用户户的的最最后后一一次次购购物物时时间间、信信用用概概要要、电电话话、地地址址等等都都可可以以从从用用户户所所提提供供的的信息和信用卡供应商处获得。信息和信用卡供应商处获得。
9、7.2.3 时间维时间维财政时间维和用户时间维财政时间维和用户时间维财政时间维分成:财政日期表和财政时刻表。财政时间维分成:财政日期表和财政时刻表。财财政政日日期期维维表表中中可可以以包包含含:候候选选财财政政日日期期关关键键字字、数数据据类类型型、季季节节、日日期期时时间间戳戳、财财政政年年、财财政政月月、财财政政周周、财财政政日日数数、日名、周天数、月天数和日类型等。日名、周天数、月天数和日类型等。财财政政时时刻刻表表中中可可以以包包含含:候候选选财财政政时时间间维维关关键键字字、时时间间类类型型、一天的时间段、一天的时间段、SQL时间戳和时间戳和GMT时分秒。时分秒。用用户户日日期期和和
10、用用户户时时刻刻表表是是从从用用户户的的观观点点来来分分析析用用户户行行为为的的,用用户日期和用户时刻是基于一个特定用户日历。户日期和用户时刻是基于一个特定用户日历。用用户户时时间间维维和和财财政政时时间间维维一一样样,同同样样被被分分成成日日期期维维表表和和时时刻刻维维表。表。用用户户日日期期维维表表包包含含属属性性同同企企业业的的日日期期维维表表类类似似。只只是是增增加加了了日日期的用户季节期的用户季节 7.2.4 地理位置维地理位置维物理地理、物理地理、Web地理地理和站点地理维和站点地理维考考虑虑用用户户的的物物理理地地理理位位置置、用用户户到到达达企企业业站站点点的的途途径径和和站站
11、点点地地理位置,这样就至少需要三个地理位置维理位置,这样就至少需要三个地理位置维 1物理地理维物理地理维物物理理地地理理维维表表中中的的属属性性一一般般可可以以包包含含:用用惟惟一一整整数数标标识识符符表表示示的的候候选选物物理理地地理理关关键键字字;国国家家、州州或或省省份份、乡乡村村或或城城市市、街街道道、门门牌牌号号、邮邮政政编编码码或或邮邮递递区区号号,地地理理位位置置是是家家庭庭、公寓、商务、政府部门等场所类型。公寓、商务、政府部门等场所类型。2Web地理维属性地理维属性主机地理维表和引用者地理维表主机地理维表和引用者地理维表 主主机机地地理理维维的的主主要要属属性性包包含含:候候选
12、选主主机机地地理理关关键键字字;主主机机Ip地地址址;主主机机名名;域域名名;主主机机所所在在国国家家、所所在在州州或或省省份份、所所在在城市等。城市等。引引用用者者地地理理维维属属性性包包含含:标标识识符符;引引用用URL;引引用用页页面面标标识识符符ID;查询字符串;引用域;已引用;查询字符串;引用域;已引用URL;已引用页面;已引用页面ID。7.2.4 地理位置维地理位置维物理地理、物理地理、Web地理地理和站点地理维和站点地理维3站点地理维属性站点地理维属性站站点点地地理理维维属属性性主主要要包包括括:表表示示候候选选站站点点地地理理ID的的惟惟一一整整数数标标识识符符;页页面面URL
13、;惟惟一一的的页页面面标标识识符符,一一个个独独立立的的页页面面标标识识符符表表示示与与页页面面相相关关联联的的动动态态页页面面URL;父父URL,例例如如,mysite/index.html;总总页页面面字字节节大大小小,包包括括所所有有组组件件项项,如如页页面面转转载载的的图图像像或或脚脚本本;页页面面版版本本号号;页页面面最最后后修修改改日日期期;页页面面主主要要用用途途,例例如如,主主页页面面、搜搜索索、信信息息、购购物物篮篮、产品说明和下载等。产品说明和下载等。7.2.5 商品维商品维内容和活动维内容和活动维3站点地理维属性站点地理维属性站站点点地地理理维维属属性性主主要要包包括括:
14、表表示示候候选选站站点点地地理理ID的的惟惟一一整整数数标标识识符符;页页面面URL;惟惟一一的的页页面面标标识识符符,一一个个独独立立的的页页面面标标识识符符表表示示与与页页面面相相关关联联的的动动态态页页面面URL;父父URL,例例如如,mysite/index.html;总总页页面面字字节节大大小小,包包括括所所有有组组件件项项,如如页页面面转转载载的的图图像像或或脚脚本本;页页面面版版本本号号;页页面面最最后后修修改改日日期期;页页面面主主要要用用途途,例例如如,主主页页面面、搜搜索索、信信息息、购购物物篮篮、产品说明和下载等。产品说明和下载等。7.2.6 促销维促销维内部促销和外部促
15、销维内部促销和外部促销维 分成内部促销维和外部促销维分成内部促销维和外部促销维1内部促销维内部促销维属属性性有有:表表示示内内部部促促销销ID的的惟惟一一整整数数标标识识符符;内内部部促促销销URL,如如,mysite/InternetSpecial4.html等等;点点击击URL;内内部部促促销销类类型型,如如,内内部部广广告告、附附属属链链接接、外外部部文文章章链链接接和和销销售售等等;内内部部促促销销版版本本;用用SKU或或服服务务码码表表示示的的内内部部促促销销产产品品或或服服务务码码;内部促销品牌;内部促销目录等。;内部促销品牌;内部促销目录等。7.2.6 促销维促销维内部促销和外部
16、促销维内部促销和外部促销维 2外部促销维外部促销维属属性性:表表示示候候选选外外部部促促销销关关键键字字的的惟惟一一整整数数标标识识符符;包包含含查查询询串串URL完完整整文文本本的的外外部部促促销销URL;外外部部促促销销引引擎擎/赞赞助助商商;外外部部促促销销格格式式,例例如如,标标语语、擎擎天天柱柱、弹弹出出式式广广告告链链接接等等;外外部部促促销销版版本本;用用SKU或或服服务务码码表表示示的的外外部部促促销销产产品品或或服服务务;外外部部促促销销品品牌牌;外外部促销目录;部促销目录;7.2.7 电子商务数据仓库模型的事实表设计电子商务数据仓库模型的事实表设计由由与与维维表表相相关关联
17、联的的外外键键以以及及网网页页点点击击加加载载时时间间、点点击击接接收收时时间间、点点击击完完成成时时间间、点点击击传传输输字字节节和和点点击击HTTP事事务务状状态态码码等等5个个度度量量浏浏览览者活动状况的事实组成者活动状况的事实组成 7.2.7 电子商务数据仓库模型的事实表设计电子商务数据仓库模型的事实表设计内容ID内容标识符内容URL内容类型内容用途相关页面内容大小内部促销ID内部促销URL内部促销类型内部促销版本内部促销码内部促销品牌内部促销目录用户时间ID时间类型时间段SQL时间戳GMT站点地理ID页面URL页面标识符父URL总页面字节引用者ID引用URL引用页面ID查询字符串已引
18、用URL网页点击加载时间点击接收时间点击完成时间点击传输字节HTTP事务状态码用户ID财政日期ID物理地理ID内容ID用户ID用户代理类型用户代理名用户类型性别注册用户名电子邮件地址消费人群财政日期ID数据类型季节日期时间戳财政年财政月财政日物理地理ID国家州或省份乡村或镇区、城市街道门牌号主机地理ID域名国家州、省、市活动ID活动标识符活动类型活动组外部促销ID外部促销URL外部促销引擎/赞助商外部促销格式外部促销版本外部促销产品/服务码外部促销品牌外部促销目录图7.3 电子商务数据仓库事实表及维表7.3 电子商务数据仓库的电子商务数据仓库的ETL设计设计7.3.1 电子商务数据仓库的电子商
19、务数据仓库的ETL环境环境人力资源数据库预算计划库存管理库存数据库混合报表与报告系统订单管理购买可接受的账户可支付的账户通用分类账ERP数据库呼叫中心数据库自动买卖买卖数据库自动销售人员购买力数据库人力资源管理税务系统固定资产呼叫中心报告系统7.3 电子商务数据仓库的电子商务数据仓库的ETL设计设计混合报表与报告系统ERP数据库自动销售人员购买力数据库Web应用服务器和数据库备份Web服务器代理服务器防火墙商业ISP因特网用户身份服务在线广告服务付费和金融服务内容缓存服务搜索引擎和服务用户/参与者ISP商业伙伴系统用户7.3 电子商务数据仓库的电子商务数据仓库的ETL设计设计7.3.2 ETL
20、的的体体系系结结构构点击流数据点击流抽取、转换点击流分析点击流分析点击流分析点击流分析点击流分析其他数据源数据抽取转换阶段区域加载数据准备区域工作存储区坏数据存储发送模式仓库加载仓库数据库商 业应 用数 据库创建维创建事实归档聚合索引确认数据仓库数据数据仓库过程管理7.3.3 建立建立ETL系统系统1数据分析数据分析2使使Web站点适合电子商务产生的点击流站点适合电子商务产生的点击流3创建高层创建高层ETL设计和体系结构设计和体系结构4设计特定的点击流组件设计特定的点击流组件7.3.3 建立建立ETL系统系统过滤记录(可选)用户辨认页面辨认过滤记录(可选)会话匹配IP地址解析分析事实记录Web
21、地理维参照表主机表Web服务维维处理会话维内容维页面维活动维用户维用户时间维物理地理维7.3.3 建立建立ETL系统系统5设计和建立维表设计和建立维表6设计和建立事实表设计和建立事实表ETL组件组件7建立数据加载机制和整合建立数据加载机制和整合ETL程序程序8为数据管理建立支持为数据管理建立支持7.4 电子商务数据挖掘电子商务数据挖掘7.4.1 Web数据挖掘技术数据挖掘技术1.Web的特点的特点Web的庞大性。的庞大性。Web的动态性。的动态性。Web的异构性。的异构性。非结构化的数据结构。非结构化的数据结构。形形色色的用户群体形形色色的用户群体7.4 电子商务数据挖掘电子商务数据挖掘2.W
22、eb内容挖掘内容挖掘基于文本信息的挖掘基于文本信息的挖掘和通常的平面文本挖掘比较类似和通常的平面文本挖掘比较类似 基于多媒体信息的挖掘基于多媒体信息的挖掘基基于于音音频频的的挖挖掘掘、基基于于图图片片的的静静态态图图像像的的挖挖掘掘和基于视频的动态图像挖掘。和基于视频的动态图像挖掘。7.4 电子商务数据挖掘电子商务数据挖掘3.Web结构挖掘结构挖掘从从WWW的组织结构和链接关系中推导知识的组织结构和链接关系中推导知识 Web结结构构挖挖掘掘有有助助于于用用户户找找到到相相关关主主题题的的权权威威站站点点,并并可可以以指指向向众众多多权权威威站站点点的的相相关关主主题题站点。站点。Hub页面提供
23、了指向权威页面的链接集合。页面提供了指向权威页面的链接集合。7.4 电子商务数据挖掘电子商务数据挖掘4.Web使用记录的挖掘使用记录的挖掘通通过过挖挖掘掘Web日日志志文文件件和和相相关关数数据据,来来发发现现用用户访问户访问Web页面的模式。页面的模式。一般的访问模式追踪和个性化的使用纪录追踪一般的访问模式追踪和个性化的使用纪录追踪 Web使使用用记记录录的的挖挖掘掘要要经经过过数数据据预预处处理理阶阶段段、模式识别阶段、模式分析阶段三个阶段。模式识别阶段、模式分析阶段三个阶段。7.4 电子商务数据挖掘电子商务数据挖掘5Web数据挖掘的意义数据挖掘的意义有助于网络资源的开发和利用有助于网络资
24、源的开发和利用有利于提高网络服务水平有利于提高网络服务水平是构建科学的决策支持系统的需要是构建科学的决策支持系统的需要7.4.2 Web数据挖掘在电子商务中的应用数据挖掘在电子商务中的应用1网络营销网络营销2客户的聚类分析客户的聚类分析3客户的个性化服务客户的个性化服务4挖掘潜在的客户挖掘潜在的客户5挽留老客户挽留老客户7.4.3 数据挖掘在网站设计、管理中的应用数据挖掘在网站设计、管理中的应用1网站设计中的数据挖掘网站设计中的数据挖掘2序列模式发现序列模式发现3在电子邮件管理中的应用在电子邮件管理中的应用4在搜索引擎中的应用在搜索引擎中的应用7.4.4 数据挖掘在网络广告中的应用数据挖掘在网络广告中的应用1网络广告的有效性分析网络广告的有效性分析2网络广告的链接分析网络广告的链接分析3网络广告的关联匹配网络广告的关联匹配4网络广告的精准发送网络广告的精准发送