《第11章分析服务精选文档.ppt》由会员分享,可在线阅读,更多相关《第11章分析服务精选文档.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第11章分析服务本讲稿第一页,共三十三页第11章 分 析 服 务11.1 分析服务简介11.2 Analysis Services数据库11.3 多维数据集11.4 数 据 挖 掘11.5 Analysis Services的安全架构本讲稿第二页,共三十三页11.1 分析服务简介SQL Server 2005 Analysis Services为商业智能应用程序提供联机分析处理(OLAP)和数据挖掘功能。1.Analysis Services的体系结构SQL Server 2005 Analysis Services使用服务器组件和客户端组件为商业智能应用程序提供联机分析处理和数据挖掘功能。A
2、nalysis Services的服务器组件作为Windows服务来实现。客户端使用公用标准XML for Analysis(XMLA)与Analysis Services进行通信,作为一项Web服务,XMLA是基于SOAP的协议,用于发出命令和接收响应。可以使用以下语言发出查询命令:SQL、MDX(多维表达式,一种用于分析的行业标准查询语言)、DMX(数据挖掘扩展插件,一种面向数据挖掘的行业标准查询语言)。本讲稿第三页,共三十三页11.1 分析服务简介2.统一维度模型统一维度模型(UDM)的作用是在用户和数据源之间搭建一座桥梁。UDM通过一个或多个物理数据源构造而成,最终用户可以使用多种客户
3、端工具之一(如Excel)来对UDM发出查询。整体架构如图所示。本讲稿第四页,共三十三页11.1 分析服务简介3.数据挖掘生成挖掘模型是大型过程的一部分,此过程包括从定义模型要解决的基本问题到将模型部署到工作环境的所有事情。此过程可以使用下列6个基本步骤进行定义:(1)定义问题。(2)准备数据。(3)浏览数据。(4)生成模型。(5)浏览和验证模型。(6)部署和更新模型。过程中每个步骤之间的关系如图所示。本讲稿第五页,共三十三页11.2 Analysis Services数据库Analysis Services数据库用做客户端应用程序的访问和安全点,也用做Analysis Services对象(
4、包括数据源、数据源视图、多维数据集、维度、挖掘结构、角色和程序集)的容器。案例11-1 在Analysis Services项目中创建数据源视图【案例描述】通过Business Intelligence Development Studio创建Analysis Services 2005项目,再在Analysis Services 2005项目中创建数据源和视图。【操作步骤】在Analysis Services项目中创建数据源视图的具体操作步骤如下:本讲稿第六页,共三十三页11.2 Analysis Services数据库(1)选择【开始】【所有程序】Microsoft SQL Server
5、2005SQL Server Business Intelligence Development Studio,打开Microsoft Visual Studio 2005开发环境。(2)关闭【起始页】选项卡。在Visual Studio中选择【文件】【创建】【项目】命令,进入【新建项目】对话框。(3)从【项目类型】窗格中选择【商业智能项目】,在【Visual Studio已安装的模板】中选择【Analysis Services 项目】。依次输入项目名称、项目位置和解决方案名称。在默认情况下,将为解决方案创建新的目录。(4)单击【确定】按钮,完成项目的创建。(5)在解决方案资源管理器中,右击【
6、数据源】,在弹出的快捷菜单中选择【新建数据源】命令,打开数据源向导。本讲稿第七页,共三十三页11.2 Analysis Services数据库(6)在【欢迎使用数据源向导】界面中,单击【下一步】按钮,进入【选择如何定义连接】界面。在此界面中,可以基于新连接、现有连接或以前定义的数据源对象来定义数据源。以前定义的数据源对象是当前项目中或当前解决方案的其他项目中的现有数据源定义。在本书中将基于新连接定义新数据源。(7)在【选择如何定义连接】界面中,选中【基于现有连接或新连接创建数据源】单选按钮,单击【新建】按钮,进入【连接管理器】界面。在此界面中,可定义数据源的连接属性。连接管理器是将在运行时使用
7、的连接的逻辑表示形式。(8)在【提供程序】下拉列表中,选择【本机OLE DBSQL Native Client】。在【服务器名称】下拉列表中,选择本地服务器JOHN-KING。选择【使用Windows身份验证】单选按钮,在【选择或输入一个数据库名】下拉列表框中,选择示例数据库Adventure Works DW。本讲稿第八页,共三十三页11.2 Analysis Services数据库(9)单击【确定】按钮,返回【选择如何定义连接】界面。(10)单击【下一步】按钮,进入【模拟信息】界面。(11)选择【使用服务账户】,单击【下一步】按钮,进入【完成向导】界面。(12)单击【完成】按钮,完成数据源
8、的设置。(13)在解决方案资源管理器中,右击【数据源视图】,在弹出的快捷菜单中选择【新建数据源视图】命令,打开【欢迎使用数据源视图向导】界面;单击【下一步】按钮,进入【选择数据源】界面。(14)在【选择数据源】界面中,【关系数据源】列表框中的Adventure Works DW数据源已被选中。本讲稿第九页,共三十三页11.2 Analysis Services数据库(15)单击【下一步】按钮,进入【名称匹配】界面;单击【下一步】按钮,进入【选择表和视图】界面。在此界面中,可以从选定的数据源提供的对象列表中选择表和视图。(16)在【可用对象】列表框中,选中一些数据表。单击按钮【】,将选中的表添加
9、到【包含的对象】列表框中。(17)单击【下一步】按钮,进入【完成向导】界面;单击【完成】按钮,完成数据源视图的创建。(18)在实际分析时,并不需要整个来源数据表中的所有字段,可以在该数据表上右击,在弹出的快捷菜单中选择【替换表】【使用新建命名查询】命令来替换原数据表。(19)在【创建命令查询】界面的【查询定义】中,选择需要显示的字段,单击【运行】按钮,执行查询。本讲稿第十页,共三十三页11.2 Analysis Services数据库1.Analysis Services数据库Analysis Services支持单个Analysis Services实例上有许多数据库,并且每个数据库都可根据
10、建立商业操作和处理模型的需要包含任意多个多维数据集和维度。单个Analysis Services数据库可合并来自任意数量的数据源(关系数据源或非关系数据源)的数据。2.Business Intelligence Development StudioBusiness Intelligence Development Studio是一种基于Microsoft Visual Studio 2005的开发环境,用于创建商业智能解决方案。使用Business Intelligence Development Studio,可以创建包含Analysis Services对象(多维数据集、维度等)定义的An
11、alysis Services项目,这些定义存储在包含Analysis Services脚本语言(ASSL)元素的XML文件内。本讲稿第十一页,共三十三页11.2 Analysis Services数据库3.Analysis Services项目Analysis Services项目包含单个Analysis Services数据库的对象定义。Business Intelligence Development Studio和SQL Server Management Studio均提供了项目,并且这些项目都纳入了各自的解决方案。一个解决方案可以包含多个项目,而一个项目通常又包含多个项。4.数据源
12、数据源提供连接Analysis Services、Integration Services和Reporting Services中所需的信息。数据源至少包含一个标识符、一个名称和一个连接字符串。Analysis Services数据库中的数据源为一个或多个数据源视图提供连接信息,Analysis Services对象(如维度、多维数据集和挖掘结构)使用这些信息引用数据。本讲稿第十二页,共三十三页11.2 Analysis Services数据库5.数据源视图数据源视图是一个对象,包含来自所选数据源对象(其中包括在基础数据源或数据源视图中定义的这些对象之间的所有关系)的元数据。使用数据源视图可以
13、定义填充大型数据仓库的数据子集。此外,通过数据源视图还可以定义基于异类数据源或数据源子集的同源架构。(1)在数据源视图中定义命名计算命名计算是一个表示为计算列的SQL表达式。该表达式作为表内的列出现并发挥作用。使用命名计算,可以扩展数据源视图中现有表或视图的关系架构,而无需修改基础数据源中的表或视图。(2)在数据源视图中定义命名查询命名查询是以表的形式表示的SQL表达式。本讲稿第十三页,共三十三页11.3 多维数据集案例11-2 创建多维数据集Cube【案例描述】使用Business Intelligence Development Studio中的维度向导在Analysis Services
14、中创建多维数据集。【操作步骤】使用多维数据集向导,基于数据源视图生成多维数据集的具体操作步骤如下。(1)在解决方案资源管理器中,右击【多维数据集】,在弹出的快捷菜单中选择【新建多维数据集】,进入【欢迎使用多维数据集向导】界面。单击【下一步】按钮,打开【选择生成方法】界面。(2)选择【使用数据源生成多维数据集】单选按钮,选中【自动生成】复选框,在下拉列表框中选择【创建属性和层次结构】。单击【下一步】按钮,进入【选择数据源视图】界面。本讲稿第十四页,共三十三页11.3 多维数据集(3)单击【下一步】按钮,进入【检测事实数据表和维度表】界面。(4)单击【下一步】按钮,进入【标识事实数据表和维度表】界
15、面。在此界面中,选择创建多维数据集所需的事实数据表和维度表。如果数据源视图中存在一个时间维度表,则在【时间维度表】下拉列表中将其选中;如果不存在时间维度表,则选中【】。本案例选择时间维度表DimTime。(5)在【关系图】选项卡中,显示数据源视图的架构,添加了颜色标记以指示“事实”或“维度”。选择架构中的任何表,单击【事实】或【维度】按钮,可以选择或清除该表中的设置;使用【缩放】按钮,可以更改放大倍数。(6)单击【下一步】按钮,进入【选择时间段】界面。在此界面中,可以指定该表中时间属性与标准时间段对应的列。在【时间属性名称】下查找标准时间段,在对应的【时间表列】下指定为【时间】维度表中的相应列
16、。本讲稿第十五页,共三十三页11.3 多维数据集(7)单击【下一步】按钮,进入【选择度量值】界面。在此界面中,标识为事实数据表中的各数值数据类型列作为度量值。选中需要作为度量值的字段。(8)单击【下一步】按钮,进入【检测层次结构】界面。在完成对维度的扫描和对层次结构的检测后,单击【下一步】按钮,进入【查看新建维度】界面。在此界面中,通过展开树控件显示检测到的维度的层次结构和属性。(9)单击【下一步】按钮,进入【完成向导】界面。在此界面中,可以查看多维数据集的度量值组、度量值、维度、层次结构和属性。(10)单击【完成】按钮,完成向导的所有设置,在【解决方案资源管理器】窗口的【多维数据集】节点下将
17、会增加这个多维数据集Cube。本讲稿第十六页,共三十三页11.3 多维数据集(11)设置完成后,可以通过Visual Studio 2005将整个数据的相关定义,包括数据源、视图、维度和多维数据集等,都部署到Analysis Services 2005服务的实例中。右击解决方案资源管理器内项目名称节点,在弹出的快捷菜单中选择【属性】命令,打开项目的属性页。在此界面中,可以设置实例所在的位置以及数据库的名称等信息。(12)右击解决方案资源管理器内项目名称节点,在弹出的快捷菜单中选择【部署】命令,Visual Studio 2005会与Analysis Services 2005通过Web Ser
18、ver沟通以部署数据库的定义到服务器实例,并持续回报进度。(13)至此,产生了一个简单的Cube结构。选择Visual Studio 2005所呈现的极其丰富的Cube设计环境的【浏览器】选项卡,进入Cube浏览器界面。可以在多维数据集设计器的【浏览器】选项卡中,根据需要查看多维数据集数据。(14)单击如图11.27所示的【浏览器】选项卡左上方的【处理】按钮,进入【处理多维数据集】界面后,单击【运行】按钮,执行多维数据集的处理过程。本讲稿第十七页,共三十三页11.3 多维数据集1.数据库维度数据库维度是相关对象(称为属性)的集合,用于提供有关一个或多个多维数据集中事实数据的信息。2.多维数据集
19、多维数据集包含用户分析事实数据所基于的所有维度。多维数据集中的数据库维度实例称为多维数据集维度,它与多维数据集中的一个或多个度量值组有关。3.定义和配置维度用法和维度关系维度用法定义了多维数据集维度与多维数据集中的度量值组之间的关系。(1)常规维度关系(2)引用维度关系(3)事实维度关系(4)多对多维度关系本讲稿第十八页,共三十三页11.3 多维数据集4.计算计算是一种多维表达式(MDX)或脚本,用于在Analysis Services中定义多维数据集的计算成员、命名集或范围分配。(1)计算成员计算成员是在运行时使用对其进行定义时所指定的多维表达式(MDX)来计算其值的成员。(2)命名集命名集
20、是返回集的CREATE SET MDX语句表达式。(3)脚本命令脚本命令是一个MDX脚本,是多维数据集定义的一部分。本讲稿第十九页,共三十三页11.3 多维数据集5.关键性能指标在Analysis Services中,KPI是指与用于评估业务绩效的多维数据集中某个度量值组关联的计算的集合。Analysis Services中常见KPI术语的定义如表所示。本讲稿第二十页,共三十三页11.3 多维数据集6.操作在Analysis Services中,操作是指可提供给客户端应用程序并由客户端应用程序使用的已存储MDX语句。Analysis Services中包含的操作类型如表所示。本讲稿第二十一页,
21、共三十三页11.3 多维数据集7.分区Analysis Services使用分区来管理和存储多维数据集中度量值组的数据和聚合。每个度量值组至少有一个分区,该分区在定义度量值组时创建。分区是用来管理多维数据集(尤其是大型多维数据集)的强大而灵活的工具。8.透视在Analysis Services中,可以使用透视来降低多维数据集表现出来的复杂度。透视可定义多维数据集的可查看子集,借此用户可以将注意力集中在多维数据集中的特定业务或特定应用程序上。透视可控制多维数据集所包含对象的可见性。9.翻译在Analysis Services中,多维数据集翻译是多维数据集对象(例如,标题或显示文件夹)的名称的特定
22、语言表示形式。翻译为可支持多种语言的客户端应用程序提供了服务器支持。本讲稿第二十二页,共三十三页11.4 数 据 挖 掘SQL Server 2005提供用于创建和使用数据挖掘模型的集成环境,称为Business Intelligence Development Studio。该环境包括数据挖掘算法和工具。案例11-3 创建用于预测方案的挖掘模型【案例描述】利用SQL Server提供用于创建和使用数据挖掘模型的集成环境,创建一个用于预测的解决方案。【技术要点】使用Analysis Services提供的数据挖掘算法、挖掘模型查看器以及数据挖掘工具。【操作步骤】创建用于预测方案的挖掘模型的具体
23、操作步骤如下:本讲稿第二十三页,共三十三页11.4 数 据 挖 掘(1)打开Business Intelligence Development Studio,新建一个项目,将新项目命名为AdventureWorks。(2)在解决方案资源管理器中,新建一个连接到Adventure WorksDW数据库的数据源。在【连接管理器】对话框中的【提供程序】下拉列表中,选择【本机OLE DBMicrosoft OLE DB Provider for SQL Server。(3)在解决方案资源管理器中新建一个数据源视图。在【选择表和视图】界面中,选择dbo.ProspectiveBuyer、dbo.vAss
24、ocSeqLineItems、dbo.vAssocSeqOrders、dbo.vDMPrep、dbo.vTargetMail、dbo.vTimeSeries包括在新数据源视图中。(4)在解决方案资源管理器中,右击【挖掘结构】,在弹出的快捷菜单中选择【新建挖掘结构】命令,打开数据挖掘向导。在【欢迎使用数据挖掘向导】界面中,单击【下一步】按钮,进入【选择定义方法】界面,选择【从现有关系数据库或数据仓库】单选按钮。本讲稿第二十四页,共三十三页11.4 数 据 挖 掘(5)单击【下一步】按钮,进入【选择数据挖掘技术】界面,在【您要使用何种数据挖掘技术】下拉列表中,选择【Microsoft 时序。(6)
25、单击【下一步】按钮,进入【选择数据源视图】界面。默认情况下,【可用数据源视图】列表框中的Adventure Works DW是选中状态。(7)单击【下一步】按钮,进入【指定表类型】界面。选中vTimeSeries表右边的【事例】复选框。(8)单击【下一步】按钮,进入【指定定型数据】界面。选中TimeIndex和ModelRegion列右边的【键】复选框,选中Quantity列右边的【输入】和【可预测】复选框。(9)单击【下一步】按钮,进入【指定列的内容和数据类型】界面。Time Index列自动指定为Key Time列,Model Region列指定为键列。这表示将为Model Region列
26、的每个唯一条目建立独立的时序模型。Time Index列中的值在Model Region列的所有值中必须是唯一的。本讲稿第二十五页,共三十三页11.4 数 据 挖 掘(10)单击【下一步】按钮,进入【完成向导】界面。(11)单击【完成】按钮,系统将打开数据挖掘设计器,显示新建的挖掘结构。(12)在【数据挖掘设计器】的【挖掘结构】选项卡的【数据源视图】窗格中,选择vTimeSeries表中的Amount(金额)列。将此列从【数据源视图】窗格拖到左边【预测】结构的列列表中,此时Amount列就成为了“预测”挖掘结构的一部分。(13)在【挖掘模型】选项卡的【结构】列中,选择与Amount相对应的单元
27、格,选中Predict(预测。(14)在【挖掘模型】选项卡中,右击Predict,在弹出的快捷菜单中选择【设置算法参数】命令,打开【算法参数】对话框。在对话框中的【值】列中,把PERIODICITY_HINT设置为“12”。本讲稿第二十六页,共三十三页11.4 数 据 挖 掘(15)在BI Development Studio的【挖掘模型】菜单中,选择【处理挖掘结构和所有模型】选项,进入【处理挖掘结构】对话框。(16)单击【运行】按钮,进入【处理进度】对话框。在此界面中,显示有关模型处理的信息示。(17)处理成功后,单击【关闭】按钮。(18)在【挖掘模型查看器】的【决策树】选项卡的【树】列表中
28、,选择M200 Pacific:Amount模型。(19)切换到【图表】选项卡,在右侧的下拉列表框中,选中R250 Europe:Amount、R250 North America:Amount和R250 Pacific:Amount,单击【确定】按钮,选中【显示偏差】复选框。本讲稿第二十七页,共三十三页11.4 数 据 挖 掘1.挖掘结构在数据挖掘中使用的两个主要对象是数据挖掘结构和数据挖掘模型。数据挖掘中涉及的其他对象是挖掘结构列和挖掘模型列。(1)数据挖掘结构挖掘结构是一种数据结构,定义生成挖掘模型的数据域。单个挖掘结构可包含多个共享相同域的挖掘模型。(2)数据挖掘模型数据挖掘模型可向挖
29、掘结构所代表的数据应用挖掘模型算法。本讲稿第二十八页,共三十三页11.4 数 据 挖 掘2.挖掘算法数据挖掘算法是创建挖掘模型的机制。Analysis Services包括了以下算法类型。分类算法基于数据集中的其他属性预测一个或多个离散变量。分类算法的一个示例是Microsoft决策树算法。回归算法基于数据集中的其他属性预测一个或多个连续变量,如利润或亏损。回归算法的一个示例是Microsoft时序算法。分割算法将数据划分为组或分类,这些组或分类的项具有相似属性。分割算法的一个示例是Microsoft聚类分析算法。关联算法查找数据集中的不同属性之间的相关性。这类算法最常见的应用是创建可用于市场
30、分析的关联规则。关联算法的一个示例是Microsoft关联算法。顺序分析算法汇总数据中的常见顺序或事件,如Web路径流。顺序分析算法的一个示例是Microsoft顺序分析和聚类分析算法。本讲稿第二十九页,共三十三页11.5 Analysis Services的安全架构保护Analysis Services的过程出现在多个级别上,必须保护Analysis Services的每个实例及其数据源,以确保只有授权的用户才能对选定的数据集、维度、单元、挖掘模型和数据源具有读或读/写权限,并阻止未经授权的用户恶意泄露敏感的商业信息。案例11-4 配置对Analysis Services的访问权限【案例描述
31、】使用Management Studio修改Analysis Services的实例的服务器角色的成员,使用Business Intelligence Development Studio向数据库角色授予权限。【操作步骤】配置对Analysis Services的访问权限的具体操作步骤如下:本讲稿第三十页,共三十三页11.5 Analysis Services的安全架构(1)打开SQL Server Management Studio,连接到Analysis Services的实例,然后在对象资源管理器中右击实例名称,在弹出的快捷菜单中选择【属性】命令。(2)在【分析服务器属性】对话框中的【常
32、规】选项卡中,选中【显示高级(全部)属性】复选框。设置【名称】为SecurityBuiltinAdminsAreServerAdmins的【值】为false,可以不允许本机系统管理员组(Administrators)内的成员直接为Analysis Services的系统管理员。(3)在【安全性】选项卡中,单击【添加】按钮,可以将一个或多个Windows用户或组添加到服务器角色。(4)打开Business Intelligence Development Studio,选择AdventureWorks项目。在解决方案资源管理器中,右击【角色】,在弹出的快捷菜单中选择【新建角色】命令。本讲稿第三十
33、一页,共三十三页11.5 Analysis Services的安全架构(5)在角色设计界面的【常规】选项卡中,可以为新建的角色授予数据库角色的各种权限。(6)在角色设计界面的【成员身份】选项卡中,可以为新建的角色指定用户和组。(7)在角色设计界面的【数据源】选项卡中,可以为新建的角色授予对数据源的访问权限。(8)在角色设计界面的【多维数据集】选项卡中,可以为新建的角色授予对多维数据集的访问权限。(9)在角色设计界面的【单元数据】选项卡中,可以为新建的角色授予对单元数据的自定义权限。(10)在角色设计界面的【维度】选项卡中,可以为新建的角色授予维度的访问权限。(11)在角色设计界面的【维度数据】
34、选项卡中,可以为新建的角色授予对维度数据的自定义访问权限。(12)在角色设计界面的【挖掘结构】选项卡中,可以为新建的角色授予访问挖掘结构和挖掘模型的权限。本讲稿第三十二页,共三十三页11.5 Analysis Services的安全架构1.授权在用户通过Windows身份验证后,Analysis Services还需要进一步确定用户是否具有查看数据、更新数据、查看元数据或执行管理任务的权限。2.角色和权限Analysis Services具有两种类型的角色:服务器角色和数据库角色。(1)管理员权限(2)维度级别的安全性(3)多维数据集级别的安全性(4)单元级别的安全性(5)挖掘结构、挖掘模型和数据源安全性3.存储过程安全性4.其他安全设置默认情况下,Analysis Services要求对客户端和Analysis Services实例之间的所有通信进行加密。而且,Analysis Services实例在设计上是安全的,可能危及安全性的功能默认处于禁用状态。本讲稿第三十三页,共三十三页