OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx

上传人:you****now 文档编号:48301711 上传时间:2022-10-05 格式:DOCX 页数:57 大小:1.87MB
返回 下载 相关 举报
OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx_第1页
第1页 / 共57页
OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx》由会员分享,可在线阅读,更多相关《OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 OLAP和数据挖掘技术在QAD产品审计中的应用与研究OLAP和和数据挖掘掘技术在QQAD产品品审计中的的应用与研究究摘要随着时代的的发展,如如今的企业业已大多进进入了“无纸化”的办公时时代。原有有的手工信信息输入与与分析已无无法适应如如今日益增增多的信息息数据。可可以说,企企业每天都都面临着大大量的商业业信息,而而如何利用用、分析好这这些数据从从而为企业业的发展提提供指导就就显得尤其其重要。对对于QADD公司而言言,它是一一家专门为为制造业提提供企业解解决方案的的软件供应应商,它在在全球范围围内的九十十多个国家家拥有超过过六千多个个客户。每每一年,它它都会对每每个客户使使用公司软软件产品的的

2、情况进行行审计。在在每个客户户审计的过过程中,自自然会产生生大量的数数据。对于于公司而言言,所有客客户的审计计数据将是是百万级的的。面对如如此庞大的的数据,如如何从这些些数据中获获取公司所所需的信息息,分析出出审计的结结果,并得得出一定的的指导性结结论就显得得尤其重要要。为此,本文文提出了一一种基于联联机分析处处理(OLLAP)和和数据挖掘掘技术的审审计信息分分析的设计计。OLAPP和数据挖挖掘技术是是近年来数数据库领域域和人工智智能领域研研究的热点点,它通过过对大量数数据进行分分析和处理理,得到隐隐含在这些些数据背后后有用的信信息和知识识。本项目目实现了基基于SQLL Serrver 200

3、88分析服务务(SSAAS)在审审计信息立立方体之上上的OLAAP多维数数据分析和和MDX多多维数据查查询,并利利用决策树树、神经网网络等数据据挖掘算法法对审计信信息数据进进行挖掘,得得出有用的的知识。为实现上述述目标,首首先需要决决定存储分分析后的审审计信息的的数据库版版本与类型型以及最终终生成审计计结果报表表所需使用用的报表生生成工具。为为此,针对对数据库的的选择提出出了以下几几种可行的的解决方案案:Proogresss数据库库、MySSQL数据据库、Acccesss数据库和和SQL Servver数据据库。根据据实际需求求,分别比比较了以上上四种数据据库的优缺缺点,最终终权衡之后后选择了

4、SSQL SServeer数据库库作为本项项目的关系系数据库服服务器。同同样,针对对报表生成成工具,也也提出了以以下几种可可行的解决决方案:QQAD公司司自己实现现的报表生生成框架、微微软的Acccesss工具和微微软的Exxcel工工具。分析析了以上几几种工具使使用的便捷捷性以及代代价考虑,最最终选择了了大家比较较常用且比比较轻量型型的Exccel作为为我们最终终的报表生生成工具。在选定了数数据库和报报表生成工工具的解决决方案之后后,便要对对历史审计计数据进行行一定的整整理、分析析以及数据据提取和存存储工作。审计数据是由公司产品所提供的功能菜单运行后自动生成的,客户在对这些多种多样的报表整理

5、时,可能根据自身的习惯进行不同的打包方式。因此公司从客户手上得到的审计数据结构则是复杂繁多的,没有一定的规律性可循,这对我们进行历史审计信息的提取造成了一定的困难与阻碍。经过对历史审计数据的详细分析之后,找到了所需要的两个审计文件:应用使用详细报告和许可权使用情况报告。其他诸如数据库使用报告等日志文件目前对我们来说并没有太大的意义。因此我们的目标只是在每个客户的审计数据文件夹下找到这两个文件,分析提取数据,并存入数据库中。在实践中,发现如果不对历史数据进行处理,直接运行数据分析提取程序,则效率十分低下。究其原因是因为程序每次都需要遍历每个文件来确认该文件是否为所需的那两个报告文件,因此要花费大

6、量的时间。为解决这一问题,就需要在程序之上再加上一层数据预处理的程序,即将不需要的历史数据文件过滤,按照原有的目录结构,只留下所需的那两个文件。这样,在数据预处理的基础上,程序运行的效率将大大提高。解决了这一问题之后,便是要将分析出的数据存入数据库中。根据历史审计数据信息及相关的外部数据信息,按照需求,共设计了六张数据表。该数据库将为后面的OLAP提供高效的数据源。有了关系数数据库源,便便可利用SSSAS对对审计数据据进行维度度建模。本本文重点论论述了审计计信息数据据的概念模模型设计和和逻辑模型型设计,包包括度量、维维度和粒度度的设计,事事实表和维维表的设计计,同时采采用了雪花花模型构造造了逻

7、辑视视图,最终终生成了审审计信息的的多维立方方体,供最最终生成审审计结果报报表和数据据挖掘提供供了多维数数据源,完完成了OLLAP在QQAD产品品审计中的的应用。在在生成审计计结果报表表时,使用用Exceel中的透透视表,建建立数据库库连接,选选择建立的的多维数据据源,便可可读取多维维数据中的的内容。为为了方便客客户审阅,特特别定义了了十多个报报表模板,可可供客户选选择,基本本涵盖了所所有的审计计结果,且且客户可以以自主选择择想要查看看的内容,对对数据进行行一定的钻钻取等,十十分方便。最后,便是是使用数据据挖掘技术术对审计数数据进行一一定的挖掘掘任务研究究。传统的的数据挖掘掘过程往往往基于关系

8、系数据库。本本文探讨了了基于OLLAP的数数据挖掘技技术在产品品审计中的的应用,分分别使用了了决策树算算法和神经经网络算法法对同一个个挖掘模型型进行了挖挖掘,并利利用提升图图比较了两两个算法的的挖掘准确确性。本文文所建立的的挖掘模型型为分析客客户选择QQAD公司司不同产品品类型组合合的因素,意意在发现一一个行业领领域内使用用QAD公公司产品组组合的最佳佳实践,为为不同的客客户在选择择公司产品品组合时提提供一定的的建议。由由于时间及及精力的有有限,只是是粗略探索索了数据挖挖掘在公司司审计中应应用的可能能性。相信信可以利用用该技术挖挖掘出更多多对公司经经营决策有有指导性意意义的知识识。本文的研究究

9、和结果表表明,OLLAP和数数据挖掘技技术在QAAD公司产产品审计中中的应用是是可行的,而而且是便捷捷高效的。它它不仅从企企业管理的的角度为公公司决策层层与销售人人员提供了了更为智能能的分析方方法和途径径,还为审审计分析人人员提供了了新的手段段和视角,来来挖掘出更更多数据背背后隐藏的的有用的知知识。关键词:数数据挖掘,OOLAP,多多维数据分分析,SQQL Seerverr 20008分析服服务,产品审计计THE AAPPLIICATIION AAND RRESEAARCH OF OLAP AND DATAA MINNING TECHHNOLOOGY IIN QAD PPRODUUCT AAU

10、DITTABSTRRACTWith the deveelopmment of tthe ssocieety, scieence and techhnoloogy, mostt of the enteerpriises havee noww entteredd thee papperleess oofficce tiime. The origginall mannual inpuut annd annalyssis ccoulddnt deeal wwith the incrreasiing iinforrmatiion aand ddata any moree. Evvery day, ent

11、terprrisess aree facced wwith lotss of busiinesss infformaationn, annd bee awaare oof knnow hhow tto usse thhese dataa to anallysiss, too proovidee guiidancce foor deeveloopmennt off thee entterprrise is eespecciallly immporttant. For QAD whicch iss a ssoftwware suppplierr commpanyy whoo proovidees

12、soolutiions to sspeciializzed mmanuffactuuringg entterprrisess, haas moore tthan 6,0000 muultipple ccliennts wwithiin 900 couuntriies wworlddwidee. Eveery yyear, alll cliientss usiing ssoftwware prodductss connditiions willl be audiited by tthe ccompaany. In eeveryy cusstomeer auudit proccess, larrg

13、e aamounnts oof daata wwill be pproduuced. Forr QADD, thhe nuumberr of all custtomerrs auddit ddata gathheredd toggetheer wiill bbe miillioons. Faciing ssuch largge nuumberrs off datta, iit iss esppeciaally impoortannt too knoow hoow too gett thee infformaationn thee commpanyy neeed, tto annalyssis

14、tthe aauditt ressultss, annd soome gguidaance concclusiions fromm thiis huuge aand mmessyy datta.Thereeforee, thhis ppaperr prooposeed a multti-diimenssionaal annalyssis oof QAAD prroducct auuditiing ddesiggn baased on OOLAP and dataa minning techhnoloogy. OLAPP andd datta miiningg tecchnollogy have

15、e beccominng a ressearcch hoot sppot oof daatabaase aand tthe ffieldd of artiificiial iintellligeence duriing rrecennt yeears. It throough the largge daata aanalyysis and proccessiing, impllicattes uusefuul innformmatioon annd knnowleedge behiind tthesee datta. TThis projject reallizedd OLAAP muulti

16、-dimeensioonal dataa anaalysiis annd MDDX muulti-dimeensioonal dataa queery oon thhe baasis of SSQL SServeer Annalyssis SServiice 22008 in tthe aauditt infformaationn cubbe, aand aachieeved audiit innformmatioon daata mmininng ussing deciisionn treees aand tthe nneuraal neetworrk daata mmininng allg

17、oriithm for audiit innformmatioon too draaw ussefull knoowleddge ffor tthe ccompaany.To acchievve thhis ggoal, we firsst neeed tto deecidee thee dattabasse veersioon annd tyype tto chhoosee, whhich is uused to sstoree thee auddit iinforrmatiion aafterr thee anaalysiis annd whhich repoortinng frramew

18、work toolls too chooose to ggenerrate finaal auudit resuult rreporrt. TThereeforee, seeveraal feeasibble ssoluttionss of dataabasees baased on ddemannd weere pput fforwaard. Theyy aree Proogresss daatabaase, MySQQL daatabaase, Acceess ddatabbase and SQL Servver ddatabbase. Acccordiing tto acctuall n

19、eeeds, and afteer coomparring eachh advvantaages and disaadvanntagees off thee aboove ffour dataabasee serrverss, thhe SQQL seerverr dattabasse waas chhosenn as the relaationnal ddatabbase servver ffinallly. Simiilarlly, ffor rreporrtingg toools, the folllowinng feeasibble ssoluttionss werre allso p

20、put fforwaard: QAD repoortinng frramewwork reallizedd by the comppany, Miccrosooft AAccesss toool aand MMicroosoftt Exccel ttoolss. Exxcel was chossen aas thhe reeportting tooll finaally becaause mostt of the userrs arre veery ffamilliar withh it and it iis poowerfful ffor ggenerratinng vaariouus re

21、eportts thhoughh it is vvery lighhtweiight.Afterr finnisheed seelecttion of ddatabbase and repoort ggenerratioon toool, the nextt steep waas too deaal wiith tthe aauditt datta. WWe neeed tto soort oout, anallysiss andd exttractt datta annd fiinallly maake tthese useeful infoormattion be sstoreed inn

22、 dattabasse coorrecctly. Auddit ddata is aautommaticc genneratted bby ussing the prodduct funcctionn mennu. CCustoomer willl worrk onn theese vvarioous rreporrts aaccorrdingg to theiir owwn haabit of ddiffeerentt pacckagiing. So tthe ccompaany oobtaiined fromm thee cusstomeer onn thee auddit ddata s

23、truucturre iss commplexx rannge, no ccertaain rregullaritty, tthis to oour hhistooricaal auudit infoormattion extrractiion hhas ccauseed soome ddiffiicultties and obsttaclees. TThrouugh aanalyyzingg thee hisstoriical dataa aftter ddetaiiled anallysiss of audiit, wwe foound out thatt onlly twwo kiind

24、s of rreporrt arre neeededd, inncludding Appllicattion Detaail UUsagee Proofilee Repport and Liceensedd Appplicaationn Repport. Othher ffiless succh ass dattabasse loog fiiles are not so iimporrtantt to us ffor nnow. So oour ggoal is tto fiind oout tthesee twoo filles iin eaach ccustoomer audiit daa

25、ta ffoldeer annd too anaalysiis, exttractt datta frrom tthesee twoo filles aand sstoree thee exttractted iinforrmatiion iin daatabaase. In ppracttice, we founnd thhat iif wee runn datta prrocesssingg prooceduure ddirecctly insttead of ppre-pproceessinng thhe hiistorricall datta fiirst, theen thhe da

26、ata pproceessinng prroceddures effficieency is vvery low. Thee reaason it tthat everry tiime tthe pproceeduree is run, it needd to travversaal evvery filee in the appoointeed foolderrs too seee wheetherr thiis fiile iis ussefull forr us or nnot, thatt is to ssay tthe pproceeduree willl oppen eeach f

27、ilee to see whetther thiss fille iss thee Appplicaationn Dettail Usagge Prrofille Reeportt andd Liccenseed Apppliccatioon Reeportt or not, thuus a lot of ttime is sspentt. Too sollve tthis probblem, it needd to pluss a llayerr of dataa preetreaatmennt prrocesss beeforee thee aboove pproceessinng prr

28、ocedduress. Thhat iis too sayy, affter runnning the dataa preetreaatmennt prrocesss, somme hiistorricall auddit ffiless whiich aare nnot nneedeed wiill bbe fiilterred, onlyy twoo kinnds oof reeportt menntionned aabovee willl bee remmaineed acccordding to tthe oorigiinal direectorry sttructture. So,

29、on the basiis off datta prretreeatmeent, the proggram willl greeatlyy impprovee thee effficieency of tthe ooperaationn. Affter solvving thiss prooblemm succcesssfullly, iit iss timme too deppositt thee anaalyzeed daata iinto dataabasee. Acccordding to tthe hhistooricaal daata iinforrmatiion aand rre

30、latted aauditting dataa infformaationn stoored in eexterrnal dataabasee, inn acccordaance withh thee reqquireementt, annd siix taabless werre deesignned. Thiss dattabasse fiillinng wiith aauditt infformaationn datta wiill pproviide eefficcientt datta soourcee forr OLAAP meentiooned beloow.Sincee we

31、alreeady havee a rrelattionaal daatabaase ssourcce noow, wwe caan usse SQQL Seerverr Anaalysiis Seervicce too buiild ddimennsionnal mmodelling for audiit daata. Thiss papper ddetaiiled disccussees thhe coonceppt off auddit ddata modeel deesignn andd loggicall moddel ddesiggn, iincluudingg thee meaas

32、uree, diimenssion and grannularrity desiign, factt tabble aand ddimennsionn tabbles desiign, alsoo adooptedd thee loggic sstruccturee moddel oof snnowfllakess, geeneraatingg a vview of tthe aauditt infformaationn andd eveentuaally geneerateed muultiddimennsionnal ccube of aauditt infformaationn, whh

33、ich provvide a muultiddimennsionnal ddata sourrce ffor aauditt ressultss staatemeents and dataa minning. So the appllicattion of OOLAP in QQAD pproduuct aauditt hass beeen brroughht innto eeffecct. IIn orrder to ggenerrate audiit reesultts reeportt, wee cann usee Exccel, estaablissh thhe piivot tabl

34、le, aand cchoosse too buiild ddatabbase connnectiion oof muultiddimennsionnal ddata sourrce. Thenn we can readd thee conntentts off thee mulltidiimenssionaal daata. In oorderr to faciilitaate ccustoomer reviiew, moree thaan teen reeportt temmplattes wwere defiined, whiich ccan bbe prrovidded ffor cc

35、ustoomer to cchoosse, bbasiccallyy coveers tthe eentirre auudit resuults, alsso cuustommers can chooose tto haave aa cheeck oon thhe coontennt annd thhe daata oof drrilliing, veryy connveniient at aall.Finallly, the dataa minning techhnoloogy sshoulld bee useed too do somee minning taskk stuudy oon

36、auudit dataa. Thhe trradittionaal daata mmininng iss oftten bbasedd on relaationnal ddatabbase. Howweverr, inn thiis paaper, it detaails the appllicattion of ddata miniing ttechnnologgy baased on OOLAP in pproduuct aauditt, ussing deciisionn treees aalgorrithmm andd thee neuural netwwork algoorithhm

37、 reespecctiveely ffor tthe ssame miniing mmodell, allso aa lifft chhart was builld too commparee thee twoo alggoritthms miiningg acccuraccy. TThis papeer esstabllisheed a miniing mmodell to findd outt thee keyy facctorss whiich iinfluuencee thee cusstomeers chooice of ddiffeerentt typpes oof QAAD pr

38、roducct coombinnatioon, iin orrder to ffind a beest ppracttice for usinng a combbinattion of pproduucts whicch QAAD prroviddes iin a speccula induustryy fieeld, whicch caan bee useed foor diifferrent typees off cusstomeers iin chhoosiing pproduucts combbinattion provvide somee sugggesttionss. Duue t

39、oo thee limmitedd timme annd ennergyy of minee, I onlyy makke a rouggh exxplorratioon off thee posssibiilityy of the appllicattion of ddata miniing iin coompanny prroducct auudit. Acccordiing tto thhe exxistiing rresullts, it iis beelievved tthat the dataa minning techhnoloogy ccan bbe ussed tto exx

40、cavaate mmore guidding signnificcancee of knowwledgge foor opperattion deciisionns.This reseearchh andd ressultss shoow thhat tthe aappliicatiion oof OLLAP aand ddata miniing ttechnnologgy inn QADD prooductt auddit iis feeasibble aand iit iss higgh effficiient and moree connveniient alsoo. Itt nott

41、onlly prrovidde moore iintellligeent aanalyysis of tthe wways and meanns foorm tthe ppersppectiive oof buusineess mmanaggemennt foor coompanny addminiistraatorss andd salles ppersoonnell, buut allso pproviided new meanns annd meethodds foorm tthe ppersppectiive oof auudit reseearchh forr thee commpa

42、nyy auddit rreseaarcheers, to ccreatte moore uusefuul knnowleedge hidiing bbehinnd thhe auudit dataa forr commpanyy devveloppmentt.Key wwordss: dataa minning, Onlline Anallyticcal PProceessinng, mmultii-dimmensiionall datta annalyssis, SQL Servver 22008 Anallysiss Serrvicees, prooductt auddit目 录第一章 绪论-11.1 QAD产品品审计问题题简述及分分析-11.2 研研究目的与与意义-111.3 国国内外研究究现状-221.4 论论文研究内内容-2第二章 解决方案比比较与选定定-42.1 数数据库的选选择-42.1.11 Proogresss数据库库-42.1.22 MySSQL数据据库-442.1.33 Acccess数数据库-42.1.44 SQLL Serrver数数据库-442.2 报报表工具的的选择-552.2.11 QADD报表生成成框架-52.2.22 微软AAccesss报表-552.2.33 微软EExcell报表-552.3 本本章小结-

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理制度

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁