《描述性统计》PPT课件.pptx

上传人:wuy****n92 文档编号:80485688 上传时间:2023-03-23 格式:PPTX 页数:51 大小:329.67KB
返回 下载 相关 举报
《描述性统计》PPT课件.pptx_第1页
第1页 / 共51页
《描述性统计》PPT课件.pptx_第2页
第2页 / 共51页
点击查看更多>>
资源描述

《《描述性统计》PPT课件.pptx》由会员分享,可在线阅读,更多相关《《描述性统计》PPT课件.pptx(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4天 津 科 技 大 学 数 学 系 谢中华MATLAB从零到进阶从零到进阶描述性统计描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4 案例背景案例背景 案例描述案例描述 描述性统计量描述性统计量 统计图统计图 频数和频率分布表频数和频率分布表主要内容:主要内容:描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第一节第一节 案例背景案例背景描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4 从一封情书

2、开始说起从一封情书开始说起亲爱的莲:亲爱的莲:我们的感情,在组织的亲切关怀下、在领导的亲自过问我们的感情,在组织的亲切关怀下、在领导的亲自过问下,一年来正沿着健康的道路蓬勃发展。这主要表现在:下,一年来正沿着健康的道路蓬勃发展。这主要表现在:(一)我们共通信(一)我们共通信121121封,平均封,平均3.013.01天一封。其中你给我天一封。其中你给我的信的信5151封,占封,占42.1%42.1%;我给你的信;我给你的信7070封,占封,占57.9%57.9%。每封信平。每封信平均均15021502字,最长的达字,最长的达52155215字,最短的也有字,最短的也有624624字。字。(二)

3、约会共(二)约会共9898次,平均次,平均3.73.7天一次。其中你主动约我天一次。其中你主动约我3838次,占次,占38.7%38.7%;我主动约你;我主动约你6060次,占次,占61.3%61.3%。每次约会平均。每次约会平均3.83.8小时小时,最长达最长达6.46.4小时,最短的也有小时,最短的也有1.61.6小时。小时。(三)我到你家看望你父母(三)我到你家看望你父母3838次,平均每次,平均每 9.49.4天一次;天一次;你到我家看望我父母你到我家看望我父母3636次,平均次,平均1010天一次。以上充分证明一天一次。以上充分证明一年来的交往我们已形成了恋爱的共识,我们爱情的主流是

4、互年来的交往我们已形成了恋爱的共识,我们爱情的主流是互相了解、互相关心、互相帮助,是平等互利的。相了解、互相关心、互相帮助,是平等互利的。描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.当然,任何事物都是一分为二的,缺点的存在是不可避免当然,任何事物都是一分为二的,缺点的存在是不可避免的。我们二人虽然都是积极的,但从以上的数据看,发展还不的。我们二人虽然都是积极的,但从以上的数据看,发展还不太平衡,积极性还存在一定的差距,这是前进中的缺点。太平衡,积极性还存在一定的差距,这是前进中的缺点。相信在新的一年里,我们一定会发扬成绩、克服缺点、携手前相信在新的一年里,我们一定会发

5、扬成绩、克服缺点、携手前进,开创我们爱情的新局面。因此,我提出三点意见供你参考:进,开创我们爱情的新局面。因此,我提出三点意见供你参考:(一)要围绕一个(一)要围绕一个“爱爱”字,字,(二)要狠抓一个(二)要狠抓一个“亲亲”字,字,(三)要落实一个(三)要落实一个“合合”字。字。让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取达到一个新高度,登上一个新台阶。本着达到一个新高度,登上一个新台阶。本着“我们的婚事我们办,我们的婚事我们办,办好婚事为我们办好婚事为我们”的精神,共创辉煌。的精神,共创辉煌。你的憨哥你的憨哥描述性统计描述性统计 谢中华

6、谢中华,MATLAB从零到进阶从零到进阶.2023/2/4 统计学家当奶爸统计学家当奶爸 有个从未管过自己孩子的统计学家,在一个星期六下午有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着:孩子。当妻子回家时,他交给妻子一张纸条,上面写着:“擦眼泪擦眼泪1111次;系鞋带次;系鞋带1515次;给每个孩子吹玩具气球各次;给每个孩子吹玩具气球各5 5次;次;每个气球的平均寿命每个气球的平均寿命1010秒钟;警告孩子不要横穿马路秒钟;警告孩子不要横穿马路2

7、626次;次;孩子坚持要穿马路孩子坚持要穿马路2626次;我还要再过这样的星期六次;我还要再过这样的星期六0 0次。次。”描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第二节第二节 案例描述案例描述描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.2-1】现有现有某两个班的某门课程的考试成绩,某两个班的某门课程的考试成绩,如如下下表所表所示。试对成绩数据进行统计分析(计算描述性统计量,绘制示。试对成绩数据进行统计分析(计算描述性统计量,绘制统计图),分析成绩是否服从正态分布。统计图),分析成绩是否服从正态分

8、布。序号序号学号学号姓名姓名成绩成绩序号序号学号学号姓名姓名成绩成绩序号序号学号学号姓名姓名成绩成绩16010101陈亮63186010118肖君扬80356010211尹浩天9026010102李旭73196010119徐欣露69366010212曾松涛8036010103刘鹏飞*206010120杨姗姗81376010213张小兵8046010104任时迁82216010121姚丽娜49386010214奚才7356010105苏宏宇80226010122张萌91396010215郭以纯7366010106王海涛70236010123张婷婷76406010216黄惠雯7276010107王

9、洋88246010124褚子贞76416010217刘丽7986010108徐靖磊80256010201曹不凡72426010218聂茜茜8096010109阎世杰92266010202付程远89436010219苏红妹81106010110姚前树84276010203李林森77446010220唐芸82116010111张金铭95286010204李强64456010221王飞燕73126010112朱星宇82296010205林志远94466010222徐思漫83136010113韩宏洁75306010206盛世74476010223许佳慧87146010114刘菲71316010207宋

10、天清98486010224杨雨婷*156010115苗艳红70326010208王润泽89496010225曾亦可90166010116宋佳艺80336010209吴鹏辉49506010226张阳85176010117王峥瑶78346010210徐佳80516010227张梓涵92描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第三节第三节 描述性统计量描述性统计量描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4一、均值一、均值 定义:定义:一首打油诗:张村有个张千万,隔壁一首打油诗:张村有个张千万,隔壁9个穷光蛋,平

11、均个穷光蛋,平均起来算一算,人人都是张百万。起来算一算,人人都是张百万。报纸上报道有个人在一条河中淹死了,这条河的平均深报纸上报道有个人在一条河中淹死了,这条河的平均深度仅度仅10cm,你信吗?,你信吗?来自国家统计局天津调查总队最新的数据显示,今年上来自国家统计局天津调查总队最新的数据显示,今年上半年天津城市居民人均可支配收入半年天津城市居民人均可支配收入12861元,北京元,北京17068元、上海元、上海18382元、重庆元、重庆11134元。元。描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4二、方差和标准差二、方差和标准差 方差:方差:标准差:标准

12、差:最常用最常用三、最大值和最小值三、最大值和最小值 最大值:最大值:最小值:最小值:描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4四、极差四、极差 极差:极差:五、中位数五、中位数六、六、p分位数分位数七、众数:七、众数:样本数据中出现最频繁的数样本数据中出现最频繁的数描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4八、变异系数八、变异系数九、九、k k阶原点矩阶原点矩十、十、k k阶中心矩阶中心矩十一、偏度十一、偏度十二、峰度十二、峰度描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023

13、/2/4十三、第一四分位数:十三、第一四分位数:样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的25%十四、第三四分位数:十四、第三四分位数:样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的75%十五、四分位间距:十五、四分位间距:最稳健最稳健描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.3-1】根据根据表表17.2-1中数据中数据,计算描述性统计,计算描述性统计量量。%求均值求均值score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);s

14、core=score(score 0);score_mean=mean(score)%求方差和标准差求方差和标准差SS1=var(score)%计算计算(17.3-1)式的方差式的方差SS1=var(score,0)%也是计算也是计算(17.3-1)式的方差式的方差SS2=var(score,1)%计算计算(17.3-2)式的方差式的方差s1=std(score)%计算计算(17.3-3)式的标准差式的标准差s1=std(score,0)%也是计算也是计算(17.3-3)式的标准差式的标准差s2=std(score,1)%计算计算(17.3-4)式的标准差式的标准差描述性统计描述性统计 谢中华

15、谢中华,MATLAB从零到进阶从零到进阶.%求最大值和最小值求最大值和最小值score_max=max(score)score_min=min(score)%求极差求极差score_range=range(score)%求中位数求中位数score_median=median(score)%求分位数求分位数score_m1=quantile(score,0.25,0.5,0.75)score_m2=prctile(score,25,50,75)%求众数求众数score_mode=mode(score)描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.%求变异系数求变异系数sc

16、ore_cvar=std(score)/mean(score)%求原点矩求原点矩A2=mean(score.2)%求中心矩求中心矩B1=moment(score,1)B2=moment(score,2)%求偏度求偏度score_skewness=skewness(score)%求峰度求峰度score_kurtosis=kurtosis(score)描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第四节第四节 统计图统计图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.一、一、样本的频数分布与频率分布样本的频数分布与频率分布将样本观测值

17、将样本观测值从小到大排列得:从小到大排列得:,列出样本频率分布表如下,列出样本频率分布表如下观测值观测值x(1)x(2)x(l)总计总计频数频数n1n2nln频率频率1描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.称称函数函数为样本分布函数(或为样本分布函数(或经验分布函数经验分布函数)。它满足分)。它满足分布函数所具有的性质。布函数所具有的性质。二、样本经验分布函数图二、样本经验分布函数图1.定义定义描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2.格里汶科定理格里汶科定理设总体设总体X 的的分布函数为分布函数为F(x),样本,样本此定理表明:

18、当样本容量此定理表明:当样本容量n n相当大时,经验分布函相当大时,经验分布函数是总体分布函数的一个良好的近似。数是总体分布函数的一个良好的近似。的经验的经验分布函数为分布函数为Fn(x),则有,则有描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.3.MATLAB实现实现cdfplot和和ecdf函数函数函数函数调用方式:调用方式:cdfplot(X)f,x=ecdf(y)功能:功能:绘制经验分布函数图绘制经验分布函数图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.4-1】根据根据表表17.2-1中数据中数据,绘制经验分

19、布函数图。,绘制经验分布函数图。%经验分布函数图经验分布函数图score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);figure;h,stats=cdfplot(score)set(h,color,k,LineWidth,2);x=40:0.5:100;y=normcdf(x,stats.mean,stats.std);hold onplot(x,y,:k,LineWidth,2);legend(经验分布函数经验分布函数,理论正态分布理论正态分布,Location,NorthWest);描述性统计描述性统计 谢中华谢中

20、华,MATLAB从零到进阶从零到进阶.(1)(1)找出样本观测值的最小值找出样本观测值的最小值x(1)和最大值和最大值x(l);(2)(2)取取ax(1)和和bx(l),将区间,将区间a,b分成分成k个子区间;个子区间;(3)(3)计算样本观测值落入各子区间内的频数计算样本观测值落入各子区间内的频数ni 和频率和频率 ;(4)(4)在在x 轴上以各子区间为底边,以轴上以各子区间为底边,以ni(或(或 )为高)为高 作小矩形即得频数(或频率)直方图。作小矩形即得频数(或频率)直方图。三、频数与频率直方图三、频数与频率直方图1.1.步骤步骤描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶

21、从零到进阶.2.MATLAB实现实现hist、ecdf和和ecdfhist函数函数函数函数调用方式:调用方式:%频数直方图频数直方图hist(Y,nbins)%频率直方图频率直方图f,x=ecdf(y)ecdfhist(f,x)功能:功能:hist函数,用来绘制频数直方图函数,用来绘制频数直方图 ecdf和和ecdfhist函数,用来绘制频率直方图函数,用来绘制频率直方图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.4-2】根据根据表表17.2-1中数据中数据,绘制频率直方图。,绘制频率直方图。%频数(率)直方图频数(率)直方图figure;

22、f,xc=ecdf(score);ecdfhist(f,xc,7);xlabel(考试成绩考试成绩);ylabel(f(x);x=40:0.5:100;y=normpdf(x,mean(score),std(score);hold onplot(x,y,k,LineWidth,2)legend(频率直方图频率直方图,正态分布密度曲线正态分布密度曲线,Location,NorthWest);描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.四、箱线图四、箱线图 设设 为总体为总体X 的一个样本,样本观测值为:的一个样本,样本观测值为:则可得出如下箱线图。则可得出如下箱线图。2

23、023/2/41.1.定义定义描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2.MATLAB实现实现boxplot函数函数调用方式:调用方式:boxplot(X)功能:功能:用来绘制箱线图用来绘制箱线图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.4-3】根据根据表表17.2-1中数据中数据,绘制箱线图。,绘制箱线图。%箱线图箱线图figure;boxlabel=考试成绩箱线图考试成绩箱线图;boxplot(score,boxlabel,notch,on,orientation,horizontal)xlabel(考试

24、成绩考试成绩);描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.五、正态概率图五、正态概率图 正态概率图用于正态分布的检验,实际上就是纵坐标经正态概率图用于正态分布的检验,实际上就是纵坐标经过变换后的正态分布的分布函数图,正常情况下,正态分布过变换后的正态分布的分布函数图,正常情况下,正态分布的分布函数曲线是一条的分布函数曲线是一条S S形曲线,而在正态概率图上描绘的形曲线,而在正态概率图上描绘的则是一条直线。则是一条直线。如果采用手工绘制正态概率图的话,可以在正态概率纸如果采用手工绘制正态概率图的话,可以在正态概率纸上描绘,正态概率纸上有根据正态分布构造的坐标系,其横上

25、描绘,正态概率纸上有根据正态分布构造的坐标系,其横坐标是均匀的,纵坐标是不均匀的,以保证正态分布的分布坐标是均匀的,纵坐标是不均匀的,以保证正态分布的分布函数图形是一条直线。函数图形是一条直线。1.1.定义定义描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2.MATLAB实现实现normplot函数函数调用方式:调用方式:h=normplot(X)功能:功能:用来绘制正态概率图用来绘制正态概率图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.4-4】根据根据表表17.2-1中数据中数据,绘制正态概率图。,绘制正态概率图。

26、%正态概率图正态概率图figure;normplot(score);描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.六、六、p-p图图 p-pp-p图用来检验样本观测数据是否服从指定的分布,是图用来检验样本观测数据是否服从指定的分布,是样本经验分布函数与指定分布的分布函数的关系曲线图。通样本经验分布函数与指定分布的分布函数的关系曲线图。通常情况下,一个坐标轴表示样本经验分布,另一个坐标轴表常情况下,一个坐标轴表示样本经验分布,另一个坐标轴表示指定分布的分布函数。每一个样本观测数据对应图上的一示指定分布的分布函数。每一个样本观测数据对应图上的一个个“+”+”号,图中有一条参

27、考直线,若图中的号,图中有一条参考直线,若图中的“+”+”号都集中号都集中在这条参考线附近,说明样本观测数据近似服从指定分布,在这条参考线附近,说明样本观测数据近似服从指定分布,偏离参考线的偏离参考线的“+”+”号越多,说明样本观测数据越不服从指号越多,说明样本观测数据越不服从指定分布。定分布。1.1.定义定义描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2.MATLAB实现实现probplot函数函数调用方式:调用方式:h=probplot(distribution,Y)功能:功能:用来绘制用来绘制 p-p 图图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进

28、阶从零到进阶.2023/2/4【例例17.4-5】根据根据表表17.2-1中数据中数据,绘制对数正态概率图。,绘制对数正态概率图。%对数正态概率图对数正态概率图figure;probplot(lognormal,score);描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.七、七、q-q图图 q-qq-q图也可用来检验样本观测数据是否服从指定的分布,图也可用来检验样本观测数据是否服从指定的分布,是样本分位数与指定分布的分位数的关系曲线图。通常情况是样本分位数与指定分布的分位数的关系曲线图。通常情况下,一个坐标轴表示样本分位数,另一个坐标轴表示指定分下,一个坐标轴表示样本分

29、位数,另一个坐标轴表示指定分布的分位数。每一个样本观测数据对应图上的一个布的分位数。每一个样本观测数据对应图上的一个“+”+”号,号,图中有一条参考直线,若图中的图中有一条参考直线,若图中的“+”+”号都集中在这条参考号都集中在这条参考线附近,说明样本观测数据近似服从指定分布,偏离参考线线附近,说明样本观测数据近似服从指定分布,偏离参考线的的“+”+”号越多,说明样本观测数据越不服从指定分布。号越多,说明样本观测数据越不服从指定分布。1.1.定义定义描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2.MATLAB实现实现qqplot函数函数调用方式:调用方式:h=qqpl

30、ot(X,Y)功能:功能:用来绘制用来绘制 q-q 图图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.4-6】根据根据表表17.2-1中数据中数据,绘制,绘制q-q图。图。banji=xlsread(examp7_1_1.xls,Sheet1,B2:B52);score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);banji=banji(score 0);score1=score(banji=60101);score2=score(banji=60102);qqplot

31、(score1,score2)描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第五节第五节 频数和频率分布表频数和频率分布表描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.一、调用一、调用tabulate函数作频数和频率分布表函数作频数和频率分布表tabulate函数函数调用方式:调用方式:TABLE=tabulate(x)功能:功能:用来作频数和频率分布表用来作频数和频率分布表描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-1】统计数值型数组中各元素出现的频数、统计数值型数组中各

32、元素出现的频数、频率。频率。x=2 2 6 5 2 3 2 4 3 4 3 4 4 4 4 2 2 6 0 4 7 2 5 8 3 1 3 2 5 3 6 2 3 5 4 3 1 4 2 2 2 3 1 5 2 6 3 4 1 2 5;tabulate(x(:)Value Count Percent 0 1 1.96%1 4 7.84%2 14 27.45%3 10 19.61%4 10 19.61%5 6 11.76%6 4 7.84%7 1 1.96%8 1 1.96%描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-2】统计字符串中各字

33、符出现的频数、频率。统计字符串中各字符出现的频数、频率。x=If x is a numeric array,TABLE is a numeric matrix.;tabulate(x)Value Count Percent I 1 2.44%f 1 2.44%x 2 4.88%i 5 12.20%s 2 4.88%a 5 12.20%n 2 4.88%u 2 4.88%描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-3】统计字符型数组中各行元素出现的频数、统计字符型数组中各行元素出现的频数、频率频率.x=崔家峰崔家峰;孙乃喆孙乃喆;安立群安

34、立群;王洪武王洪武;王玉杰王玉杰;高纯静高纯静;崔家峰崔家峰;叶叶 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;tabulate(x)Value Count Percent 崔家峰崔家峰 3 21.43%孙乃喆孙乃喆 2 14.29%安立群安立群 1 7.14%王洪武王洪武 1 7.14%王玉杰王玉杰 1 7.14%高纯静高纯静 1 7.14%叶叶 鹏鹏 1 7.14%关泽满关泽满 1 7.14%谢中华谢中华 2 14.29%王宏志王宏志 1 7.14%描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17

35、.5-4】统计字符串元胞数组中各字符串出现统计字符串元胞数组中各字符串出现的频率。的频率。x=崔家峰崔家峰;孙乃喆孙乃喆;安立群安立群;王洪武王洪武;王玉杰王玉杰;高纯静高纯静;崔家峰崔家峰;叶叶 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;tabulate(x)Value Count Percent 崔家峰崔家峰 3 21.43%孙乃喆孙乃喆 2 14.29%安立群安立群 1 7.14%王洪武王洪武 1 7.14%王玉杰王玉杰 1 7.14%高纯静高纯静 1 7.14%叶叶 鹏鹏 1 7.14%关泽满关泽满 1 7.14%谢中华谢中华 2 14.

36、29%王宏志王宏志 1 7.14%描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-5】统计名义尺度(如性别,职业,产品型号等)统计名义尺度(如性别,职业,产品型号等)数组中各元素出现的频数、频率。数组中各元素出现的频数、频率。%载入载入MATLAB自带的鸢尾花数据自带的鸢尾花数据 load fisheriris%将字符串元胞数组将字符串元胞数组species转为名义尺度数组转为名义尺度数组 species=nominal(species);tabulate(species)Value Count Percent setosa 50 33.3

37、3%versicolor 50 33.33%virginica 50 33.33%描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.二、调用自编二、调用自编HistRate函数作频数和频率分布表函数作频数和频率分布表HistRate函数函数调用方式:调用方式:result=HistRate(x)功能:功能:用来作频数和频率分布表用来作频数和频率分布表描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-1续续】统计数值型数组中各元素出现的频数、统计数值型数组中各元素出现的频数、频率。频率。x=2 2 6 5 2 3 2 4 3

38、 4 3 4 4 4 4 2 2 6 0 4 7 2 5 8 3 1 3 2 5 3 6 2 3 5 4 3 1 4 2 2 2 3 1 5 2 6 3 4 1 2 5;HistRate(x)取值取值 频数频数 频率频率 累积频率累积频率 0 1 1.96%1.96%1 4 7.84%9.80%2 14 27.45%37.25%3 10 19.61%56.86%4 10 19.61%76.47%5 6 11.76%88.24%6 4 7.84%96.08%7 1 1.96%98.04%8 1 1.96%100.00%描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023

39、/2/4【例例17.5-2续续】统计字符串中各字符出现的频数、频率。统计字符串中各字符出现的频数、频率。x=If x is a numeric array,TABLE is a numeric matrix.;HistRate(x)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)I 1 2.4390 2.4390 f 1 2.4390 4.8780 x 2 4.8780 9.7561 i 5 12.1951 21.9512 s 2 4.8780 26.8293 a 5 12.1951 39.0244 n 2 4.8780 43.9024 u 2 4.8780 48.7805描述

40、性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-3续续】统计字符型数组中各行元素出现的统计字符型数组中各行元素出现的频数频率频数频率.x=崔家峰崔家峰;孙乃喆孙乃喆;安立群安立群;王洪武王洪武;王玉杰王玉杰;高纯静高纯静;崔家峰崔家峰;叶叶 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;HistRate(x)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)崔家峰崔家峰 3 21.4286 21.4286 孙乃喆孙乃喆 2 14.2857 35.7143 安立群安立群 1 7.1429

41、42.8571 王洪武王洪武 1 7.1429 50 王玉杰王玉杰 1 7.1429 57.1429 高纯静高纯静 1 7.1429 64.2857 叶叶 鹏鹏 1 7.1429 71.4286 关泽满关泽满 1 7.1429 78.5714 谢中华谢中华 2 14.2857 92.8571 王宏志王宏志 1 7.1429 100描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-4续续】统计字符串元胞数组中各字符串出现统计字符串元胞数组中各字符串出现的频率。的频率。x=崔家峰崔家峰;孙乃喆孙乃喆;安立群安立群;王洪武王洪武;王玉杰王玉杰;高纯

42、静高纯静;崔家峰崔家峰;叶叶 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;HistRate(x)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)崔家峰崔家峰 3 21.4286 21.4286 孙乃喆孙乃喆 2 14.2857 35.7143 安立群安立群 1 7.1429 42.8571 王洪武王洪武 1 7.1429 50 王玉杰王玉杰 1 7.1429 57.1429 高纯静高纯静 1 7.1429 64.2857 叶叶 鹏鹏 1 7.1429 71.4286 关泽满关泽满 1 7.1429 78.5714 谢中华谢中华 2

43、14.2857 92.8571 王宏志王宏志 1 7.1429 100描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.5-5续续】统计名义尺度(如性别,职业,产品型号等)统计名义尺度(如性别,职业,产品型号等)数组中各元素出现的频数、频率。数组中各元素出现的频数、频率。load fisheriris species=nominal(species);HistRate(species)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)setosa 50 33.3333 33.3333 versicolor 50 33.3333 66.6667 virginica 50 33.3333 100

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁