《审计数据预处理.pptx》由会员分享,可在线阅读,更多相关《审计数据预处理.pptx(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第5章章审计数据预处理审计数据预处理5-1计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社本章学习目标本章学习目标q理解审计数据理解审计数据预处理预处理的重要性的重要性q理解数据质量、审计数据质量问题;掌握审计数理解数据质量、审计数据质量问题;掌握审计数据预处理的意义以及审计数据预处理的内容据预处理的意义以及审计数据预处理的内容 q结合应用实例熟悉审计数据结合应用实例熟悉审计数据预处理预处理的基本方法的基本方法q理解审计数据预处理阶段数据验证的重要性、熟理解审计数据预处理阶段数据验证的重要性、熟悉审计数据预处理阶段数据验证的内容和方法悉审计数
2、据预处理阶段数据验证的内容和方法q了解其它一些数据预处理方法了解其它一些数据预处理方法 2计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社q概述概述q审计数据预处理理论分析审计数据预处理理论分析q审计数据预处理应用实例审计数据预处理应用实例q审计数据预处理阶段的数据验证审计数据预处理阶段的数据验证q其它数据预处理方法介绍其它数据预处理方法介绍本章主要内容本章主要内容3计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社q数据质量数据质量q单数据源数据质量问题单数据源数据质量问题q多数据源集成时数据质
3、量问题多数据源集成时数据质量问题q审计数据质量实例审计数据质量实例q审计数据预处理的意义审计数据预处理的意义q审计数据预处理的内容审计数据预处理的内容审计数据预处理理论分析审计数据预处理理论分析4计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社什么是数据质量呢?数据质量问题并不仅仅是指数据错误。有的文献把数据质量定义为数据的一致性(consistency)、正确性(correctness)、完整性(completeness)和最小性(minimality)这4个指标在信息系统中得到满足的程度,有的文献则把“适合使用”作为衡量数据质量的初步标准。
4、数据质量数据质量5计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社准确性(准确性(AccuracyAccuracy)准确性是指数据源中实际数据值与假定正确数据值的一致程度;完整性(完整性(CompletenessCompleteness)完整性是指数据源中需要数值的字段中无值缺失的程度;一致性(一致性(ConsistencyConsistency)一致性是指数据源中数据对一组约束的满足程度;唯一性(唯一性(UniquenessUniqueness)唯一性是指数据源中记录以及编码是否唯一;适时性(适时性(TimelinessTimeliness)
5、适时性是指在所要求的或指定的时间提供一个或多个数据项的程度;有效性(有效性(ValidityValidity)有效性是指维护的数据足够严格以满足分类准则的接受要求。数据质量的评价指标数据质量的评价指标6计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社重复的数据重复的数据 不完整的数据不完整的数据 不正确的数据不正确的数据 无法理解的数据值无法理解的数据值 不一致的数据不一致的数据 可能存在的数据质量问题可能存在的数据质量问题 7计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社数据质量问题数据质量
6、问题单数据源问题单数据源问题多数据源问题多数据源问题模式级问题模式级问题缺乏完整性约束、差的模式设计实例级问题实例级问题数据输入错误模式级问题模式级问题异构的数据模型和模式设计实例级问题实例级问题冲突和不一致的数据拼写错误重复的数据冲突的数据命名冲突结构冲突唯一值参照完整性不一致的汇总不一致的时间选择. . . . . . . . . . . . .数据质量问题分类数据质量问题分类8计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社单数据源数据质量问题单数据源数据质量问题9计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华
7、大学出版社清华大学出版社单数据源数据质量问题单数据源数据质量问题10计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社当多个数据源集成时,发生在单数据源中的这些问题会更加严重。这是因为每个数据源都是为了特定应用,单独开发、部署和维护的,这就很大程度上导致数据管理系统、数据模型、模式设计和实际数据的不同。每个数据源都可能含有脏数据,多数据源中的数据可能会出现不同表示、重复、冲突等现象。在模式级,模式设计的主要问题是命名冲突和结构冲突。命名冲突主要表现为不同的对象可能使用同一个命名,而同一对象可能使用不同的命名;结构冲突存在很多种不同的情况,一般是指
8、在不同数据源中同一对象有不同表示,如不同的组成结构、不同的数据类型、不同的完整性约束等。多数据源集成时数据质量问题多数据源集成时数据质量问题11计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社除了模式级的冲突,很多冲突仅出现在实例级上,即数据冲突。由于不同数据源中数据的表示可能会不同,单数据源中的所有问题都可能会出现,比如重复的记录、冲突的记录等。此外,在整个数据源中,尽管有时不同的数据源中有相同的字段名和类型,仍可能存在不同的数值表示,如对性别的描述,一个数据源中可能用“0/1”来描述,另一个数据源中可能会用“F/M”来描述,或者对一些数值的
9、不同表示,如一个数据源中度量单位制可能用美元,另一个数据源中可能会用欧元。此外,不同数据源中的信息可能表示在不同的聚集级别上,如一个数据源中信息可能指的是每种产品的销售量,而另一个数据源中信息可能指的是每组产品的销售量。多数据源集成时数据质量问题多数据源集成时数据质量问题12计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社审计数据质量实例审计数据质量实例-不完整数据不完整数据13计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社审计数据质量实例审计数据质量实例-不完整数据不完整数据14计算机辅助审
10、计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社审计数据质量实例审计数据质量实例-不一致的数据不一致的数据15计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社审计数据质量实例审计数据质量实例-不正确的数据不正确的数据16计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社审计数据质量实例审计数据质量实例-重复的数据重复的数据17计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社q为下一步的审计数据分析提供准备为下一
11、步的审计数据分析提供准备q帮助发现隐含的审计线索帮助发现隐含的审计线索q降低审计风险降低审计风险审计数据预处理的意义审计数据预处理的意义18计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社q数据转换数据转换q数据清理数据清理审计数据预处理的内容审计数据预处理的内容19计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社图5.7 数据清理原理手工清理数据清理业务知识自动清理脏数据满足数据质量要求的数据清理算法清理规则数据预处理的内容数据预处理的内容20计算机辅助审计原理及应用(第二版)计算机辅助审计原
12、理及应用(第二版) 清华大学出版社清华大学出版社数据预处理应用实例数据预处理应用实例-采用采用Access名称转换名称转换 21计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社数据预处理应用实例数据预处理应用实例-采用采用Access空值处理空值处理 22计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社数据预处理应用实例数据预处理应用实例-采用采用AO借助生成数据中间表 23计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社数据预处理应用实例数据预
13、处理应用实例-采用采用AO采用AO中的常规数据整理功能 24计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社审计数据预处理阶段数据验证的重要性审计数据预处理阶段数据验证的重要性 在审计数据预处理过程中,审计人员会将原始电子数据中表名、字段名、记录值代码以及表表关联的经济含义明确标识出来,这需要进行大量的查询、替换修改、插入数据、删除数据等操作;另外,要对电子数据进行修改错误值、替换空值、消除冗余数据、保证数据值落入定义域等数据操作,以提高数据质量,为下一步的审计数据分析做好准备。在审计数据预处理过程中可能存在以下问题:(1)目标数据模式设计不合
14、理。(2)审计数据预处理方法不当。(3)审计数据预处理工具使用不合适。(4)审计数据预处理过程不规范,没有日志记录。根据以上分析,每一步预处理工作都有可能影响到数据的完整性和正确性,所以在这一阶段进行数据验证也是很必要的。 25计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社q 确信数据预处理的目标实现确信数据预处理的目标实现q 确认数据预处理工作没有损害数据的完整性、正确性确认数据预处理工作没有损害数据的完整性、正确性审计数据预处理阶段数据验证的内容和方法审计数据预处理阶段数据验证的内容和方法 审计数据验证的主要内容审计数据验证的主要内容 审
15、计数据验证的方法审计数据验证的方法 在审计数据预处理阶段,审计人员可以根据实际情况,采用核对总金额、保持借贷平衡、勾稽关系、审计抽样等数据验证方法来完成审计数据验证。26计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社q 不完整数据的清理不完整数据的清理q 相似重复记录的清理相似重复记录的清理其它数据预处理方法介绍其它数据预处理方法介绍 27计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社q为什么要对被审计数据进行审计数据预处理?为什么要对被审计数据进行审计数据预处理?q什么是数据质量?什么是数据质量?q常见审计数据质量问题有哪些?常见审计数据质量问题有哪些? 思考题思考题28计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社相关参考书相关参考书 29计算机辅助审计原理及应用(第二版)计算机辅助审计原理及应用(第二版) 清华大学出版社清华大学出版社相关参考书相关参考书 30