审计数据预处理课件.pptx

上传人:一*** 文档编号:82677278 上传时间:2023-03-26 格式:PPTX 页数:23 大小:1.23MB
返回 下载 相关 举报
审计数据预处理课件.pptx_第1页
第1页 / 共23页
审计数据预处理课件.pptx_第2页
第2页 / 共23页
点击查看更多>>
资源描述

《审计数据预处理课件.pptx》由会员分享,可在线阅读,更多相关《审计数据预处理课件.pptx(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第五章第五章 审计数据预处理审计数据预处理q概述概述q审计数据预处理理论分析审计数据预处理理论分析q数据预处理应用实例数据预处理应用实例q数据预处理阶段的数据验证数据预处理阶段的数据验证q其它数据预处理方法介绍其它数据预处理方法介绍第1页/共23页q数据质量概念及分类数据质量概念及分类q单数据源数据质量问题单数据源数据质量问题q多数据源集成时数据质量问题多数据源集成时数据质量问题q审计数据质量实例审计数据质量实例q数据预处理的意义数据预处理的意义q数据预处理的内容数据预处理的内容审计数据预处理理论分析审计数据预处理理论分析第2页/共23页什么是数据质量呢?数据质量问题并不仅仅是指数据错误。有的

2、文献把数据质量定义为数据的一致性(consistency)、正确性(correctness)、完整性(completeness)和最小性(minimality)这4个指标在信息系统中得到满足的程度,有的文献则把“适合使用”作为衡量数据质量的初步标准。数据质量的概念数据质量的概念第3页/共23页准确性(准确性(AccuracyAccuracy)准确性是指数据源中实际数据值与假定正确数据值的一致程度;完整性(完整性(CompletenessCompleteness)完整性是指数据源中需要数值的字段中无值缺失的程度;一致性(一致性(ConsistencyConsistency)一致性是指数据源中数据

3、对一组约束的满足程度;唯一性(唯一性(UniquenessUniqueness)唯一性是指数据源中记录以及编码是否唯一;适时性(适时性(TimelinessTimeliness)适时性是指在所要求的或指定的时间提供一个或多个数据项的程度;有效性(有效性(ValidityValidity)有效性是指维护的数据足够严格以满足分类准则的接受要求。评价数据质量的指标评价数据质量的指标第4页/共23页数据质量问题分类数据质量问题分类第5页/共23页单数据源数据质量问题单数据源数据质量问题第6页/共23页单数据源数据质量问题单数据源数据质量问题第7页/共23页当多个数据源集成时,发生在单数据源中的这些问题

4、会更加严重。这是因为每个数据源都是为了特定应用,单独开发、部署和维护的,这就很大程度上导致数据管理系统、数据模型、模式设计和实际数据的不同。每个数据源都可能含有脏数据,多数据源中的数据可能会出现不同表示、重复、冲突等现象。在模式级,模式设计的主要问题是命名冲突和结构冲突。命名冲突主要表现为不同的对象可能使用同一个命名,而同一对象可能使用不同的命名;结构冲突存在很多种不同的情况,一般是指在不同数据源中同一对象有不同表示,如不同的组成结构、不同的数据类型、不同的完整性约束等。多数据源集成时数据质量问题多数据源集成时数据质量问题第8页/共23页除了模式级的冲突,很多冲突仅出现在实例级上,即数据冲突。

5、由于不同数据源中数据的表示可能会不同,单数据源中的所有问题都可能会出现,比如重复的记录、冲突的记录等。此外,在整个数据源中,尽管有时不同的数据源中有相同的字段名和类型,仍可能存在不同的数值表示,如对性别的描述,一个数据源中可能用“0/1”来描述,另一个数据源中可能会用“F/M”来描述,或者对一些数值的不同表示,如一个数据源中度量单位制可能用美元,另一个数据源中可能会用欧元。此外,不同数据源中的信息可能表示在不同的聚集级别上,如一个数据源中信息可能指的是每种产品的销售量,而另一个数据源中信息可能指的是每组产品的销售量。多数据源集成时数据质量问题多数据源集成时数据质量问题第9页/共23页不完整数据

6、不完整数据第10页/共23页不完整数据不完整数据第11页/共23页不一致的数据不一致的数据第12页/共23页不正确的数据不正确的数据第13页/共23页重复的数据重复的数据第14页/共23页q为下一步的审计数据分析提供准备为下一步的审计数据分析提供准备q帮助发现隐含的审计线索帮助发现隐含的审计线索q降低审计风险降低审计风险数据预处理的意义数据预处理的意义第15页/共23页q数据转换数据转换q数据清理数据清理数据预处理的内容数据预处理的内容第16页/共23页数据预处理的内容数据预处理的内容第17页/共23页q采用采用AccessAccessq采用采用AOAO数据预处理应用实例数据预处理应用实例第1

7、8页/共23页q(1 1)确信数据预处理的目标实现)确信数据预处理的目标实现q(2 2)确认数据预处理工作没有损)确认数据预处理工作没有损害数据的完整性、正确性害数据的完整性、正确性数据预处理阶段的数据验证数据预处理阶段的数据验证第19页/共23页q不完整数据的清理不完整数据的清理q相似重复记录的清理相似重复记录的清理其它数据预处理方法其它数据预处理方法第20页/共23页思考题思考题q为什么要对被审计数据进行数据预处理?为什么要对被审计数据进行数据预处理?q什么是数据质量?什么是数据质量?q评价数据质量的主要指标有哪些?评价数据质量的主要指标有哪些?第21页/共23页Question?Question?第22页/共23页感谢您的观看。第23页/共23页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁