《样本数据处理-习题及答案许桂秋ch03 数据的导入与导出.docx》由会员分享,可在线阅读,更多相关《样本数据处理-习题及答案许桂秋ch03 数据的导入与导出.docx(1页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
第3章数据的导入与导出什么是CDC (变化数据捕获)?变化数据捕获(Change Data Capture,缩写CDC)是指识别和捕获对数据库中的数据所做 的更改(包括数据或数据表的插入、更新、删除等),然后将这些更改按发生的顺序完整记 录下来,并实时通过消息中间件传送到下游流程或系统的过程。通过这种方式,CDC能够向 数据仓库提供高效、低延迟的数据传输,以便信息被及时转换并交付给专供分析的应用程序。在ETL工作中,我们常常面临着处理各种类型文件的场景,请列举几个经常 处理的文件类型。TXT、CSV、Excel XML、JSON 等。简述基于源数据的CDC操作的优缺点。优点:数据抽取的性能高,ETL加载规则简单,速度快,不需要修改业务系统表结构,可以实现 数据的递增加载。缺点:要求业务表建立触发器,对业务系统有一定的影响,容易对源数据库构成威胁简述基于日志的CDC操作的优缺点。基于查询的CDC:优点是实现简单,是通过批处理实现的,需要依赖离线调度,不能保证数据 强一致性和实时性。简述基于触发器的CDC操作的优缺点。略。