《大数据数据预处理心得体会范文大数据预处理的概念(2篇).docx》由会员分享,可在线阅读,更多相关《大数据数据预处理心得体会范文大数据预处理的概念(2篇).docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 大数据数据预处理心得体会范文大数据预处理的概念(2篇)关于大数据数据预处理心得体会范文一 1.负责数据etl开发,优化etl流程设计; 2.负责数据质量问题的分析、跟进、解决,进展数据质量监测、校验和提升; 3.负责etl开发实施文档的编写; 4.负责梳理公司数据仓库/数据集市数据清单、数据映射关系,优化现有数据仓库模型; 5.完善和梳理数据指标体系,完成和维护数据字典的工作; 6.参加数据标准的制定、数据标准治理和数据安全治理工作; 7.参加公司大数据平台的建立,包括sugar报表或神策接口配置,用户画像标签体系的开发等 任职要求: 1.有shell或python脚本开发阅历; 2.有传统
2、数据库sql server和mysql,有存储过程编写力量; 3.熟识hadoop生态相关技术并有相关实践阅历,包括但不限于sqoop、hive、hbase、kylin等开发阅历; 4.有kettle、azkaban或oozie工作流调度阅历; 5.熟识hive sql或flink sql的开发; 6.有数据仓库模型设计,有使用kafka+flink streaming实时数据处理阅历优先; 7.有sugar、神策或tableau使用阅历,有用户画像或客户召回标签工作阅历优先; 8.对数据挖掘和机器学习有所了解,包括常用的机器学习算法和数据建模过程的优先 关于大数据数据预处理心得体会范文二 职
3、责: 1、参加数据etl和数据仓库治理; 2、参加大数据分析和挖掘,共性化推举等系统的设计和开发; 3、负责数据挖掘、自然语言处理及猜测等相关模型、算法的设计与开发; 4、参加bi等系统根底数据支撑开发; 5、参加用户画像、用户行为评分、行业指数、销售猜测等功能模块的开发; 6、参加爬虫等外部相关数据爬取。 任职要求: 1、熟识概率论和统计方法; 2、把握统计学习方法和机器学习算法者优先; 3、把握java,理解mapreduce开发思维,能独立开发分布式计算;熟识shell、r、matlab、octive、python等脚本语言或应用开发者优先; 4、熟识关系型数据库mysql等,了解nosql; 5、具备工程化思维,思索数据业务能够全面慎重; 6、具备快速学习的力量和业务理解力,对数据开发有深厚的兴趣,具备理解和整合算法的力量。