《(本科)(03)第3章数据的描述统计量(Py1)ppt课件.pptx》由会员分享,可在线阅读,更多相关《(本科)(03)第3章数据的描述统计量(Py1)ppt课件.pptx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、课程主讲人:(03)第3章 数据的描述统计量(Py1)第 1 章1 - 2统计学Python实现贾俊平2022-5-11PythonPython 实现实现第 3 章3 - 3统计学Python实现贾俊平2022-5-11第 3 章3 - 4统计学Python实现贾俊平2022-5-11 描述水平的统计量 描述水平的统计量描述水平的统计量平均值平均值# # 简单平均数:80.0# 加权平均数:81.0第 3 章3 - 5统计学Python实现贾俊平2022-5-11 描述水平的统计量 描述水平的统计量描述水平的统计量分位数分位数中位数中位数l分位数一组数据按从小到大排序后,可以找出排在某个位置上
2、的数值,该数值可以代表数据水平的高低。这些位置上的数值就是相应的分位数(quantile)。常用的分位数有中位数、四分位数、百分位数等l中位数排序后处于中间位置上的值。不受极端值影响# # 计算3030名学生考试分数的中位数中位数:85.0第 3 章3 - 6统计学Python实现贾俊平2022-5-11 描述水平的统计量 描述水平的统计量描述水平的统计量分位数分位数四分位数四分位数l一组数据排序后处在25%和75%位置上的数值。它是用3个点将全部数据等分为4部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上和75%位置上的两个数值#
3、 【例3-5】第 3 章3 - 7统计学Python实现贾俊平2022-5-11 描述水平的统计量 描述水平的统计量描述水平的统计量分位数分位数百分位数百分位数l 用99个点将数据分成100等份,处在各分位点上的数值就是百分位数。百分位数提供了各项数据在最小值和最大值之间分布的信息# # 计算3030名学生考试分数的百分位数第 3 章3 - 8统计学Python实现贾俊平2022-5-11 描述水平的统计量 描述水平的统计量描述水平的统计量众数众数l 一组数据中出现次数最多的变量值l 一组数据可能没有众数或有几个众数l 实际中很少使用# 计算30名学生考试分数的众数众数=86第 3 章3 -
4、9统计学Python实现贾俊平2022-5-11 描述差异的统计量 描述差异的统计量描述差异的统计量极差和四分位差极差和四分位差l 极差:一组数据的最大值与最小值之差l 四分位差:上四分位数与下四分位数之差# 计算30名学生考试分数的极差和四分位差# 极差=47# 四分位差:IQR = 19.5第 3 章3 - 10统计学Python实现贾俊平2022-5-11 描述差异的统计量 描述差异的统计量描述差异的统计量方差和标准差方差和标准差l 方差:各变量值与均值的平均差异l 标准差:方差的平方根# 计算30名学生考试分数的方差和标准差方差:174.6206896551724# 标准差标准差:13
5、.21第 3 章3 - 11统计学Python实现贾俊平2022-5-11 描述差异的统计量 描述差异的统计量描述差异的统计量变异系数变异系数(CV)l标准差与其相应的均值之比l对数据相对离散程度的测度l用于比较不同系列数据的离散程度【例【例3-9】(数据:example2_3. csv)沿用第2章的例2-3。计算6个城市AQI的平均数、标准差和变异系数,比较AQI离散程度的大小第 3 章3 - 12统计学Python实现贾俊平2022-5-11 描述差异的统计量 描述差异的统计量描述差异的统计量标准分数标准分数l对某一个值在一组数据中相对位置的度量,也称标准化值l可用于判断一组数据是否有离群
6、点(outlier)# # 【例310310】计算例3-1的标准分数标准分数: 0.3784 -1.8919 0.8324 -1.0594 -0.0757 1.2865 0.9081 -1.8919 0.5297 0.7567 0.227 -0.7567 1.2108 -0.6054 0.7567 -1.4378 0.454 0.454 0.9081 0.3784 -0.9838 0.0757 0.6811 -2.2702 1.1351 0.454 -0.3784 0.8324 0.1513 -1.0594第 3 章3 - 13统计学Python实现贾俊平2022-5-11 描述分布形状的统计
7、量 描述分布形状的统计量描述分布形状的统计量偏度系数偏度系数# # 计算偏度系数偏度系数: -0.8314第 3 章3 - 14统计学Python实现贾俊平2022-5-11 描述分布形状的统计量 描述分布形状的统计量描述分布形状的统计量峰度系数峰度系数例题分析例题分析l峰度(kurtosis)是指数据分布峰值的高低l由统计学家K.Pearson于1905年首次提出l峰度系数峰度系数测度一组数据分布峰 值 高 低 的 统 计 量 是(coefficient of kurtosis),记作K# 计算峰度系数峰度系数: -0.3515第 3 章3 - 15统计学Python实现贾俊平2022-5-
8、11 数据的综合和描述数据的综合和描述 数据的综合描述数据的综合描述例题分析例题分析【例例3-9】6名运动员的涉及成绩第 3 章3 - 16统计学Python实现贾俊平2022-5-11 数据的综合和描述数据的综合和描述 数据的综合描述数据的综合描述例题分析例题分析图形描述图形描述【例例312】60个大学生的调查数据图形分析第 3 章3 - 17统计学Python实现贾俊平2022-5-11 数据的综合和描述数据的综合和描述 数据的综合描述数据的综合描述例题分析例题分析图形描述图形描述【例例312】60个大学生的调查数据图形分析第 3 章3 - 18统计学Python实现贾俊平2022-5-11 数据的综合和描述数据的综合和描述 数据的综合描述数据的综合描述例题分析例题分析统计量描述统计量描述第 3 章3 - 19统计学Python实现贾俊平2022-5-11 数据的综合和描述数据的综合和描述 数据的综合描述数据的综合描述例题分析例题分析统计量描述统计量描述 THE END THE END T H A N K S T H A N K S2022-5-11