大数据基础教案-模块5 大数据分析与挖掘.docx

上传人:太** 文档编号:96801349 上传时间:2024-03-21 格式:DOCX 页数:4 大小:16.36KB
返回 下载 相关 举报
大数据基础教案-模块5 大数据分析与挖掘.docx_第1页
第1页 / 共4页
大数据基础教案-模块5 大数据分析与挖掘.docx_第2页
第2页 / 共4页
点击查看更多>>
资源描述

《大数据基础教案-模块5 大数据分析与挖掘.docx》由会员分享,可在线阅读,更多相关《大数据基础教案-模块5 大数据分析与挖掘.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、教学单元模块五大数据分析与挖掘授课方式理论课 口实验(实训)课 13理实一体课 其他课时8教学目标知识目标令了解数据分析的概念和目的。令理解数据分析的一般过程。令了解传统数据分析方法和大数据分析方法。令了解数据挖掘的概念、分类和挖掘对象。令理解数据挖掘的常用技术和算法。能力目标令能够熟练运用大数据分析的方法及工具。令能够熟练运用数据挖掘的方法及工具。令熟悉NumPy工具基本使用方法令熟悉Pandas工具的基本使用方法令熟悉Scikit-learn工具的基本使用方法素质目标令培养学生自主学习、协同工作以及知识应用的能力。令培养学生的数据安全意识与防护能力。令培养学生良好的职业道德,不弄虚作假,力

2、求数据真实性。教学重点 难点教学重点。大数据分析与挖掘的方法和工具令NumPy的基本用法令Pandas的基本用法令Scikit-learn的基本用法教学难点令数据挖掘相关算法令NumPy的基本用法令Pandas的基本用法令Scikit-learn的基本用法教学方法 与手段教学方法令讲授法令实验法教学手段令多媒体令分组讨论令分组实验教学过程 课程导入上一个模块学习了大数据采集的相关概念及方法,大数据预处理的概 念以及数据清洗、数据集成、数据转换和数据规约等主要处理方法。本模 块主要介绍大数据分析与挖掘的概念和方法,以及常用的大数据分析和挖 掘工具,并设计了相应的实训项目来提升学习者的动手能力。

3、讲授主要内容一、大数据分析1.数据分析过程(1)识别信息需求(2)收集数据(3)分析数据(4)过程改进2.数据分析方法(1)传统数据分析方法 对比分析 分组分析 回归分析 指标分析 预测分析(2)大数据分析方法 可视化分析 数据挖掘算法 预测性分析 语义引擎 数据质量和数据管理3.大数据分析工具(1) FineBI(2) Tableau(3) Smartbi(4)亿信ABI(5) QuickBI二、数据挖掘1 ,数据挖掘的功能(1)自动预测趋势和行为(2)关联分析(3)聚类(4)概念描述(5)偏差检测2 .数据挖掘的方法(1)分类(2)回归分析(3)聚类分析(4)关联规则(5)特征分析(6)变

4、化和偏差分析(7) Web页挖掘3 .数据挖掘算法(1)神经网络法(2)决策树法(3)遗传算法(4)粗糙集法(5)模糊集法(6)关联规则法4 .数据挖掘工具(1) NumPy(2) Pandas(3) Scikit-learn(4) SAS(5) RapidMiner(6) WEKA(7) KNIME(8) Orange(9) IBM SPSS三、实训实训一安装NumPy1 .训练要点熟悉NumPy模块的安装方法。2 .需求说明在Windows和Linux系统中,学习使用pip安装NumPy模块,安装后进 行验证。3 .实现思路及步骤(1)在Windows系统中,安装NumPy的最简单的方法就

5、是使用pip命令, 其中,一user选项用于设置只安装在当前用户下,而不是写入系统目录。(2)默认情况下使用国外线路,但国外线路速度较慢,因此通过镜像安装。(3)在Ubuntu&Debian系统中,可以使用apt-get命令安装NumPyo安装 NumPy需要使用sudo命令请求管理员权限。(4)在CentOS/Fedora系统中,可以使用dnf命令安装NumPy。安装NumPy 需要使用sudo命令请求管理员权限。(5)可以在Python命令行模式下验证NumPy是否安装成功。实训二利用NumPy进行排序1 .训练要点熟悉numpy. sort ()函数的基本用法。2 .需求说明熟悉nump

6、y. sort ()函数的用法,利用numpy. sort ()函数对矩阵行元素或 列元素进行排序。3 .实现思路及步骤(1)确定待排序的矩阵。(2)确定矩阵元素排序的轴(行或列)。(3)确定排序方法。(4)确定要排序的字段。实训三利用Pandas进行统计分析1 .训练要点(1)熟悉Pandas的安装方法。(2)利用Pandas对数据进行基本统计分析。2 .需求说明研究电信客户流失现象可以帮助电信企业改善服务质量,维护好客户关 系。分析电信客户流失数据之前,要对数据进行基本统计分析。本实训将利 用Pandas对某国各州的电信客户流失数据进行基本统计分析。3 .实现思路及步骤(1)下载并安装Pa

7、ndaso(2)利用Pandas对某国各州的电信客户流失数据进行统计分析。实训四 利用Scikit-learn进行分类1 .训练要点(1)使用Scikit-learn载入莺尾花卉数据集。(2)划分莺尾花卉数据集。(3)训练KNN分类器。(4)利用训练好的KNN分类器进行数据预测。2 .需求说明利用Scikit-learn中的KNN分类算法对莺尾花进行分类。通过Scikit- learn 的已有数据集库载入莺尾花卉数据集,导入训练数据和对应的标签,对模型进行训练。 利用训练好的模型进行数据预测。3 .实现思路及步骤(1)导入Scikit-learn中的数据分割包、数据集包、KNN模型。(2)导入

8、莺尾花卉数据集。(3)将莺尾花卉数据集划分为训练集和测试集数据。(4)训练KNN模型。(5)对测试集中的数据进行预测。 小结本模块首先介绍了大数据分析和大数据挖掘的基本概念、方法、技术等, 然后通过实训讲解了简单的数据分析处理的方法,以便读者更好地理解数据 分析的基本流程。Python提供了很多用于数据分析处理的工具包,如 NumPy Pandas Sklearn等,这些工具包可以有效提高数据分析处理的效率, 感兴趣的读者可以在掌握本模块实训的基础上,深入了解工具包中的其他功 能,这有助于全面理解大数据分析处理方法。1 .课后习题课后任务2 .安装NumPy并利用NumPy进行排序;3 .利用Pandas进行统计分析;4 .利用Scikit-learn进行分类;

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁