《Python数据分析与可视化教案1.2 认识Python.docx》由会员分享,可在线阅读,更多相关《Python数据分析与可视化教案1.2 认识Python.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、课 题1. 2 认识 Python课 型讲练授课班级大数据授课时数1教学目标1. 了解Python语言的特点2. 了解Python常用库的名称及作用教学重点1.了解Python语言的特点教学难点1. 了解Python常用库的名称及作用学情分析学生之前一般都是上过Pyhon课,但是不一定学过Python中的一些第 三方库,比方Pandas、Numpy等,但是这些库在数据分析中很重要。教学效果本次课是Python的导入课,通过本次课的学习,能够对于Python的各 种库有一个基本了解。教后记苏州工业职业技术学院Suzhou Institute Of Industr ial Technology教师
2、备考首页一、Python的开展趋势Pylhon是一种跨平台的计算机程序设计语言,是由Guido van Rossum在八十年 代末和九十年代初,在荷兰国家数学和计算机科学研究所设计出来的。自从20世纪 90年代初Python语言诞生至今,已被逐渐被广泛应用于系统管理任务处理。自从20()4 年以后,Pylhon的使用率呈线性增长。目前,Pylhon已经成为最受欢迎的程序设计语 言之一。Python 2于2000年10月16日发布,稳定版本是Python 2.70 Python 3于2008 年12月3日发布,不完全兼容Python 2。二、Python的特点1 .易于学习Pylhon有相对较少
3、的关键字,结构也比拟简单,与其他程序语言相比,学习起来 更加简单,比方在Python变量不需要声明可以直接使用,再比方些第三方库集成 了很多计算功能,大大简化编程的难度。2 .易于阅读Pylhon代码定义清晰,比方语句的组织依赖于缩进而不是用符号标记,如循环结 构的“开始/结束”可直接用缩进而不需要使用其他的符号。3 .开发效率高Pylhon是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库。高 级数据结构可以在一个单独的语言中表达出很复杂的操作,比方调用第三方库中的很 多方法,就可以防止写很多循环。4 .可移植性强基于其开放源代码的特性,Pylhon已经被移植(也就是使其工作)到许
4、多平台。三、Python的常用库l.numpyNumPy是Numerical Python的简称,是Python语言的一个扩展程序库,支持大 量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的 前身Numeric最早是由Jim Hugunin与其它协作者共同开发,2005年,Travis Oliphant在Numeric中结合了另一个同性质的程序库Nuniarray的特色,并加入了 其它扩展而开发了 NumPyoNumPy支持高级大量的维度数组与矩阵运算,底层是C语言实现的,由于针对 数组运算提供大量的数学函数库,计算速度比拟快,运算效率极好,是机器学习框架 的基础类
5、库。2.SciPySciPy是构建在numpy基础之上的数据计算库,它提供了许多的操作numpy的数 组的函数。SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包,它 包括了统计、优化、整合以及线性代数模块、傅里叶变换、信号和图像图例,常微分 方差的求解等。Scipy的子模块包括:模块名功能简介scipy.cl uster向量量化scipy.constants数学常量scipy. fftpack快速傅里叶变换scipy. integrate积分scipy.interpolate插值scipy.io数据输入输出scipy.linalg线性代数scipy.spatial空间数据
6、结构和算法scipy.special特殊数学函数scipy.stats统计函数3. pandas表格容器pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务 而创立的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数 据集所需的工具。pandas提供了大量快速便捷地处理数据的函数和方法,使得Python 成为强大而高效的数据分析环境的重要因素之一。pandas使用一个二维的数据结构DataFramc来表示表格式的数据,同时使用NaN 来表示缺失的数据,而不用像Numpy需要手工处理缺失的数据,并且pandas使用轴 标签来表示行和列。同时,pandas可以对
7、数据进行导入、清洗、处理、统计和输出, 所以pandas库就是一个数据分析库。4. matpoltlibMalplotlib是Python在绘制2D图形领域中使用最广泛的套件,它能让使用者很 轻松地将数据图形化,并旦提供多样化的输出格式。通过Matplotlib,用户可以仅需 要几行代码,便可以生成绘图。一般可绘制折线图、散点图、柱状图、饼图、直方图、 子图等等。Matplot使用Numpy进行数组运算,并调用一系列其他的Python库来实 现硬件交互。matplotlib中应用最为广泛的模块是matplotlib.pyplot模块,该模块为matplotlib 提供的一套和MATLAB类似的
8、绘图API,以方便快速绘图。将众多绘图对象所构成 的复杂结构隐藏在这套API内部。我们只需要调用pyplot模块所提供的函数就可以实 现快速绘图以及设置图表的各种细节。matplodib.pyplot模块对外提供函数式的接口, 其内部实际保存了当前图表以及当前子图等信息。5. SeabornSeaborn是一种基于matplotlib的图形可视化Python libraty。它提供了一种高度交 互式界面,便于用户能够做出各种有吸引力的统计图表。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图 更加容易,在大多数情况下使用seaborn就能做出很具有吸引力
9、的图,而使用matplotlib 就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。 同时它能高度兼容numpy与pandas数据结构以及scipy与statsinodels等统计模式。 掌握seaborn能很大程度帮助我们更高效的观察数据与图表,并且更加深入了解它们。Seaborn主要包括如下特点:(1)基于matplotlib aesthetics绘图风格,增加了一些绘图模式(2)增加调色板功能,利用色彩丰富的图像揭示您数据中的模式(3)运用数据子集绘制与比拟单变量和双变量分布的功能(4)灵活运用处理时间序列数据(5)利用网格建立复杂图像集6.scikit-leamskleam是Scipy的扩展,建立在Numpy和malplolib库的基础上。利用这几大模 块的优势,可以大大地提高机器学习的效率。scikit-learn简称sklearn,支持包括分类, 回归,降维和聚类四大机器学习算法。还包括了特征提取,数据处理和模型评估者三 大模块。skleam拥有着完善的文档,上手容易,具有着丰富的APL skleam己经封装 了大量的机器学习算法。同时skleam内置了大量数据集,节省了获取和整理数据集 的时间。