《样本数据处理-教学大纲.docx》由会员分享,可在线阅读,更多相关《样本数据处理-教学大纲.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、样本数据处理教学大纲一、课程信息课程名称:样本数据处理课程类别:素质选修课/专业基础课课程性质:选修/必修计划学时:64计划学分:4先修课程:无选用教材:样本数据处理,许桂秋,朱婷婷,李春平主编,2022年,电子工业出版 社教材。适用专业:本课程可作为高等院校数据科学与大数据技术、计算机、信息管理等相关专 业课程的基础课程,也可供对样本数据处理技术感兴趣的学生阅读。课程负责人:二、课程简介本课程从实用的角度出发,采用理论与实践相结合的方式,介绍样本数据处理的基础知 识,力求培养读者使用Python语言及Kettle软件进行数据处理的能力。本课程内容分别为 数据预处理概述、Kettle工具的初步
2、使用、数据的导入与导出、数据清洗、数据标注、Kettle 作业设计、基于Kettle构建数据仓库、基于Python的数据导入与导出、基于Python的数据 整理。本课程作为人工智能学科相关的样本数据处理技术的入门课程,目的不是覆盖样本数 据处理技术的所有知识点,而是介绍样本数据处理的主要应用,使学生了解样本数据处理的 基本构成,以及如何应对不同数据类型的数据预处理工作。为了增强实践效果,课程中引入 了多个基础技术案例及综合实践案例,以帮助学生了解样本数据处理涉及的基本技术的知识 和技能。三、课程教学要求序号专业毕业要求课程教学要求关联程度1工程知识1 .掌握Kettle工具的初步使用、数据的导
3、入与导出、数 据清洗等内容的方法。2 .了解样本数据处理的应用领域和市场需求,为产品设 计和开发提供指导。L2问题分析1 .学会对样本数据处理中出现的问题进行分析和解决, 包括硬件故障、软件错误、网络问题等。2 .学会进行故障排除和维修和计算方法,以实现数据处 理应用。H3设计/开发解决方案1.掌握基于Python的数据导入与导出和整理,能将样本 数据处理应用到工作和生活领域中。H2.学会进行系统测试和验证,以确保系统的质量和性能 符合要求。4研究L5使用现代工具1 .掌握在数据处理领域研发的现代工具,如仿真软件、 调试工具等。2.学会使用现代工具进行数据分析和处理,提高工作效 率和准确性。M
4、6工程与社会1 .了解样本数据处理对社会的影响和作用,以及相关的 法律法规和标准。2 .学会将相应技术应用于实际生产和社会服务中,为社 会做出贡献。L7环境和可持续发展L8职业规范L9个人和团队L学会个人发展和团队合作,提高个人和团队的综合素 质。2.学会与他人合作和沟通,建立良好的人际关系和团队 合作氛围。H10沟通1 .学会进行有效的沟通和表达,与客户、同事和上级保 持良好的沟通和协作。2.学会进行跨文化沟通和合作,提高国际化视野和跨文 化交流能力。M11项目管理L学会进行项目管理和组织,包括项目计划、进度控制、 质量管理等。2.学会进行风险评估和管理,提高项目成功的概率和效 率。L12终
5、身学习1 .学会进行自我学习和自我提升,不断提高自身的专业 水平和创新能力。2 .学会进行终身学习和职业发展规划,不断拓展职业领 域和发展空间。H、课程教学内容注:“课程教学要求”栏中内容为针对该课程适用专业的专业毕业要求与相关教学要求的具 体描述。“关联程度”栏中字母表示二者关联程度。关联程度按高关联、中关联、低关联三 档分别表示为“H” 或L”。“课程教学要求”及“关联程度”中的空白栏表示该课程 与所对应的专业毕业要求条目不相关。章节名称主要内容重难点关键词学时类型1数据预处理概 述数据预处理的背景与目 的数据预处理的流程数据预处理的工具了解数据预处理的背景与 目的、数据预处理的流程、 数
6、据预处理的工具4理论+ 实操U!2Kettle工具的 初步使用Kettle的安装Kettle的使用掌握Kettle的安装、转换 的基本概念、可视化编程 及调试、定时启动转换4理论+ 实操3数据的导入与 导出基于文件的数据导入与 导出基于数据库的数据导入 与导出基于Web的数据导入与 导出基于CDC变更数据的导 入与导出掌握基于文件的数据导入 与导出、基于数据库的数 据导入与导出、基于Web 的数据导入与导出、基于 CDC变更数据的导入与 导出8理论+ 实操4数据清洗数据清洗概述数据排重使用脚本组件进行数据 清洗掌握Kettle常用的数据清 洗步骤、重复数据的识别 及去除JavaScript代码
7、组 件清理数据、正则表达式 组件清理数据6理论+ 实操5数据标注数据标注简介 数据标注分类 数据标注质量检验 图像数据标注实战 文本标注实战掌握数据标注简介、数据 标注分类、数据标注质量 检验、图像数据标注实战10理论+ 实操6Kettle作业设 计作业的概念及组成作业的执行方式业的创建及常用作业项变量监控命令行启动作业实验掌握作业的概念及组成、 作业的执行方式、作业的 创建及常用作业工页、变 量、监控、命令行启动、 作业实验14理论+ 实操7基于Kettle构 建数据仓库数据仓库的介绍 构建维度表 构建事实表掌握数据仓库的介绍、构 建维度表、构建事实表6理论+ 实操8基于Python 的数据
8、导入与 导出Pandas文本文件的导入与导出 Excel文件的导入与导出 数据库的导入与导出理解Pandas、文本文件的 导入与导出、Excel文件 的导入与导出、数据库的 导入与导出6理论+ 实操9基于Python 的数据整理合并多个数据集数据重塑数据转换掌握合并多个数据集、数 据重塑、数据转换6理论+ 实操五、考核要求及成绩评定序号成绩类别考核方式考核要求权重()备注1期末成绩期末考试大作业50百分制,60分为及格2平时成绩实践9次40优、良、中、及格、不及格3平时表现出勤情况10两次未参加课程则无法获得学分注:此表中内容为该课程的全部考核方式及其相关信息。六、学生学习建议(一)学习方法建
9、议L依据专业教学标准,结合岗位技能职业标准,通过案例展开学习,将每个项目分成多 个任务,系统化地学习。2 .通过每个项目最后搭配的习题,巩固知识点。3 .了解行业企业技术标准,注重学习新技术、新工艺和新方法,根据教材中穿插设置的 智能终端产品应用相关实例,对已有技术持续进行更新。4 .通过开展课堂讨论、实践活动,增强的团队协作能力,学会如何与他人合作、沟通、 协调等等。(二)学生课外阅读参考资料样本数据处理,许桂秋,朱婷婷,李春平主编,2022年,电子工业出版社教材。七、课程改革与建设本课程作为人工智能学科相关的样本数据处理技术的入门教材,目的不是覆盖样本数据 处理技术的所有知识点,而是介绍样本数据处理的主要应用,使学生了解样本数据处理的基 本构成,以及如何应对不同数据类型的数据预处理工作。为了增强实践效果,课程中引入了 多个基础技术案例及综合实践案例,以帮助学生了解样本数据处理涉及的基本技术的知识和 技能。平时对学生的考核内容包括出勤情况、学生的学习成果、课堂讨论等方面,占期末总评 的50%。期末考试成绩占期末总评的50%。制订人签字:教研室主 任签字:院部负责人 签字:修订时间:年月日