《学年高中数学 2.2.1 用样本的频率方程估计总体的分布1课件 新人教B必修3.ppt》由会员分享,可在线阅读,更多相关《学年高中数学 2.2.1 用样本的频率方程估计总体的分布1课件 新人教B必修3.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.1 用样本的频率分布估计用样本的频率分布估计总体的分布总体的分布(二)2021/8/8 星期日1二、总体密度曲线二、总体密度曲线 1频率分布折线图频率分布折线图 把频率分布直方图各个长方形上边的中把频率分布直方图各个长方形上边的中点用线段连接起来,就得到点用线段连接起来,就得到频率分布折线频率分布折线图图。为了方便看图,一般习惯于把频率分布为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左折线图画成与横轴相连,所以横轴上的左右两端点没有实际的意义。例如,前面的右两端点没有实际的意义。例如,前面的钢管内径的频率分布折线图,如图所示。钢管内径的频率分布折线图,如图所示。
2、2021/8/8 星期日2频率分布直方图:频率分布直方图:2021/8/8 星期日3频率分布折线图频率分布折线图2021/8/8 星期日42总体密度曲线总体密度曲线 如果样本容量越大,所分组数越多,上如果样本容量越大,所分组数越多,上述图中表示的频率分布就越接近于总体在述图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大各个小组内所取值的个数与总数比值的大小。小。设想如果样本容量不断增大,分组的组设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光来越接近于总体的分布,它可以用一条光滑
3、曲线滑曲线y=f(x)来描绘,这条光滑曲线就叫做来描绘,这条光滑曲线就叫做总体密度曲线。总体密度曲线。2021/8/8 星期日5 总体密度曲线总体密度曲线精确地精确地反映了一个总体反映了一个总体在各个区域内取值的规律。在各个区域内取值的规律。产品尺寸落在产品尺寸落在(a,b)内的内的百分率百分率就是图就是图中带斜线部分的面积。中带斜线部分的面积。对前面钢管内径的例子来说,总体密对前面钢管内径的例子来说,总体密度曲线呈中间高两边低的度曲线呈中间高两边低的“钟钟”形分布,形分布,总体的数据大致呈对称分布,并且大部总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内分数据都集中在靠近中间
4、的区间内。2021/8/8 星期日62021/8/8 星期日7例:对于样本频率分布折线图与总体密度例:对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是(曲线的关系,下列说法中正确的是()(A)频率分布折线图与总体密度曲线无)频率分布折线图与总体密度曲线无关关 (B)频率分布折线图就是总体密度曲线)频率分布折线图就是总体密度曲线 (C)样本容量很大的频率分布折线图就)样本容量很大的频率分布折线图就是总体密度曲线是总体密度曲线 (D)如果样本容量无限增大,分组的组)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无距无限减小,那么频率分布折线图就会无限接近于总体密度曲
5、线限接近于总体密度曲线D2021/8/8 星期日8解析:总体密度曲线通常是用样本频率分解析:总体密度曲线通常是用样本频率分布估计出来的;因为如果样本容量无限增布估计出来的;因为如果样本容量无限增大,分组的组距无限缩小,那么频率分布大,分组的组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线,这折线图就会无限接近于一条光滑曲线,这条曲线就是总体密度曲线,故选条曲线就是总体密度曲线,故选D.2021/8/8 星期日9(1)总体密度曲线与总体分布相互唯一)总体密度曲线与总体分布相互唯一确定,如果总体分布已知,就可以得到总确定,如果总体分布已知,就可以得到总体密度曲线的函数表达式,从而用函数的
6、体密度曲线的函数表达式,从而用函数的理论去研究它。但我们所面临的情况是总理论去研究它。但我们所面临的情况是总体分布未知,因此,我们只能体分布未知,因此,我们只能通过样本频通过样本频率分布折线图近似表示总体密度曲线率分布折线图近似表示总体密度曲线,当,当然还可以用其他方法估计总体密度曲线,然还可以用其他方法估计总体密度曲线,但不能够通过样本数据准确地画出总体密但不能够通过样本数据准确地画出总体密度曲线。度曲线。进一步理解:进一步理解:2021/8/8 星期日10(2)总体密度曲线的)总体密度曲线的实际意义实际意义在于:在于:总体密度曲线与总体密度曲线与x轴,直线轴,直线x=a,x=b围围成的成的
7、面积等于面积等于x在在a,b取值时的取值时的概率概率.2021/8/8 星期日112.茎叶图茎叶图 茎叶图也是用来表示数据的一种图,茎叶图也是用来表示数据的一种图,茎是中间的一列数,茎是中间的一列数,叶是从茎上生长出来叶是从茎上生长出来的数的数.例甲、乙两篮球运动员在上赛季每场比例甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得赛的得分如下,试比较这两位运动员的得分水平分水平甲:甲:12,15,24,25,31,31,36,36,37,39,44,49,50乙:乙:8,13,14,16,23,26,28,33,38,39,512021/8/8 星期日12解:画出两人得分的茎
8、叶图解:画出两人得分的茎叶图2021/8/8 星期日13 茎叶图的中间部分像一颗植物的茎,两茎叶图的中间部分像一颗植物的茎,两边部分像这颗植物上长出来的叶子。边部分像这颗植物上长出来的叶子。用中间的数字表示两位运动员得分的十用中间的数字表示两位运动员得分的十位数,两边的数字分布表示两个人各场得位数,两边的数字分布表示两个人各场得分的个位数,例如分的个位数,例如 3|389 就表示了就表示了33,38,39这这3个数据。个数据。2021/8/8 星期日14 从这个茎叶图可以看出甲运动员的得从这个茎叶图可以看出甲运动员的得分大致对称平均得分及中位数、众数都分大致对称平均得分及中位数、众数都是是30
9、多分;乙运动员的得分除一个多分;乙运动员的得分除一个51外,外,也大致对称,平均得分及中位数、众数也大致对称,平均得分及中位数、众数都是都是20多分,因此甲运动员发挥比较稳多分,因此甲运动员发挥比较稳定,总体得分情况比乙好定,总体得分情况比乙好 2021/8/8 星期日15画茎叶图的步骤画茎叶图的步骤 S1 将每个数据分为茎(高位)和叶将每个数据分为茎(高位)和叶(低位)两部分;(低位)两部分;S2 将最小茎和最大茎之间的数按大小将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;次序排成一列,写在左(右)侧;S3 将各个数据的叶按大小次序写在其将各个数据的叶按大小次序写在其茎右(左)
10、侧。茎右(左)侧。2021/8/8 星期日16几种表示样本分布的几种表示样本分布的方法比较方法比较:(1)频率分布表频率分布表在数量表示上比较确切,在数量表示上比较确切,但不够直观、形象,分析数据分布的总体但不够直观、形象,分析数据分布的总体态势不太方便;态势不太方便;(2)频率分布直方图频率分布直方图能够很容易地表示能够很容易地表示大量数据,非常直观地表明分布的形状,大量数据,非常直观地表明分布的形状,使我们能够看到频率分布表中看不清楚使我们能够看到频率分布表中看不清楚的数据模式,但是从频率分布直方图本的数据模式,但是从频率分布直方图本身不能得出原始的数据内容,也就是说,身不能得出原始的数据
11、内容,也就是说,把数据表示成直方图后,原有的具体数把数据表示成直方图后,原有的具体数据信息就被抹掉了。据信息就被抹掉了。2021/8/8 星期日17(3)频率分布)频率分布折线图折线图的优点是它反映了的优点是它反映了数据的变化趋势,如果样本容量不断增数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图大,分组的组距不断缩小,那么折线图就趋向于就趋向于总体密度曲线总体密度曲线。(4)用)用茎叶图茎叶图刻画数据有两个优点:一刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够到;二是茎叶图便于记录和表示,能够展
12、示数据的分布情况,但当样本数据较展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不多或数据位数较多时,茎叶图就显得不太方便了。太方便了。2021/8/8 星期日18例例1.在某电脑杂志的一篇文章中,每个在某电脑杂志的一篇文章中,每个句子的字数如下:句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,22,11,24,27,17.在某报纸的一篇文章中,每个句子的在某报纸的一篇文章中,每个句子的字数如下:字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,
13、18,46,32,22。2021/8/8 星期日19(1)将这两组数据用茎叶图表示;)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到)将这两组数据进行比较分析,得到什么结论?什么结论?(1)将)将这两组数这两组数据用茎叶据用茎叶图表示;图表示;2021/8/8 星期日20(2)电脑杂志上每个句子的字数集中在)电脑杂志上每个句子的字数集中在10,30之间,之间,中位数为中位数为22.5,而报纸上每,而报纸上每个句子的字数集中在个句子的字数集中在20,40之间,之间,中位数中位数为为27.5,还可以看出电脑杂志上每个句子,还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均
14、字数的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要简要少,说明电脑杂志作为科普读物需要简洁明了、通俗易懂。洁明了、通俗易懂。2021/8/8 星期日21例例2.有人说:有人说:“茎叶图表示三位数以上的茎叶图表示三位数以上的数据时不够方便数据时不够方便”,果真如此吗?请看下例:果真如此吗?请看下例:现在能否用茎叶图来表示上述数据呢?现在能否用茎叶图来表示上述数据呢?2021/8/8 星期日22解:从上述数据可以看到它们的百位数字解:从上述数据可以看到它们的百位数字都是都是3,所不同的仅仅是十位和个位,而,所不同的仅仅是十位和个位,而两位数据是可以作茎的,那么只需在茎的两位
15、数据是可以作茎的,那么只需在茎的位置写上百位和十位,叶的位置上写上个位置写上百位和十位,叶的位置上写上个位即可。位即可。2021/8/8 星期日23例例3.某运动员得分的茎叶图如下,试判某运动员得分的茎叶图如下,试判断他的得分的中位数,众数及稳定程度断他的得分的中位数,众数及稳定程度.2021/8/8 星期日24解:从这个图可以直观的看出该运动员得解:从这个图可以直观的看出该运动员得分的中位数是分的中位数是36、众数是、众数是31与与36,且得分大都在且得分大都在20和和40之间,分布较对称,之间,分布较对称,集中程度高,说明其发挥比较稳定集中程度高,说明其发挥比较稳定 2021/8/8 星期
16、日25练习题:练习题:1.在频率分布直方图中,小矩形的高表示在频率分布直方图中,小矩形的高表示()A.频率频率/样本容量样本容量 B.组距组距频率频率 C.频率频率 D.频率频率/组距组距D2021/8/8 星期日262.在用样本频率估计总体分布的过程中,在用样本频率估计总体分布的过程中,下列说法中正确的是(下列说法中正确的是()A.总体容量越大,估计越精确总体容量越大,估计越精确 B.总体容量越小,估计越精确总体容量越小,估计越精确 C.样本容量越大,估计越精确样本容量越大,估计越精确 D.样本容量越小,估计越精确样本容量越小,估计越精确 C2021/8/8 星期日273.一个容量为一个容量
17、为20的样本数据,分组后组距的样本数据,分组后组距与频数如下表与频数如下表.组组距距10,20)20,30)30,40)40,50)50,60)60,70)频频数数234542则样本在区间则样本在区间(,50)上的频率为上的频率为()A.0.5 B.0.25 C.0.6 D.0.7D2021/8/8 星期日284.10个小球分别编有号码个小球分别编有号码1,2,3,4,其,其中中1号球号球4个,个,2号球号球2个,个,3号球号球3个,个,4号球号球1个,数个,数0.4是指是指1号球占总体分布的(号球占总体分布的()A.频数频数 B.频率频率 C.频率频率/组距组距 D.累计频率累计频率B202
18、1/8/8 星期日295.已知样本:已知样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为,那么频率为0.25的样本的样本的范围是的范围是()A.5.5,7.5)B.7.5,9.5)C.9.5,11.5)D.11.5,13.5)D2021/8/8 星期日306.频率分布直方图中,小长方体的面积等频率分布直方图中,小长方体的面积等于于()A.相应各组的频数相应各组的频数 B.相应各组的频率相应各组的频率 C.组数组数 D.组距组距B 2021/8/8 星期日317.将容量为将容量为50的数据,按从小到大的顺序的数据,按从小到大
19、的顺序分为分为6组,如下表组,如下表.组组号号123456频频数数6810 1097第第3组的频率和前组的频率和前3组的累计频率是(组的累计频率是()A.0.24和和0.5B.0.2和和0.48 C.0.06和和0.24 D.0.14和和0.48B2021/8/8 星期日328.从一群学生中抽取一个一定容量的样本从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超对他们的学习成绩进行分析,已知不超过过70分的人数为分的人数为8人,其累计频率为人,其累计频率为0.4,则这样的样本容量是(则这样的样本容量是()A.20人人B.40人人 C.70人人D.80人人A2021/8/8 星
20、期日339.一个容量为一个容量为n的样本分成若干组,已知的样本分成若干组,已知某组的频数和频率分别是某组的频数和频率分别是30和和0.25,则,则n=_.12010.将将100个数据分成个数据分成8个组,其中有一组个组,其中有一组是是9个数据,那么该组的频数是个数据,那么该组的频数是_,频率是频率是_.90.092021/8/8 星期日3411.从某校从某校2100名学生随机抽取一个名学生随机抽取一个30名名学生的样本,样本中每个学生用于课外作学生的样本,样本中每个学生用于课外作业的时间(单位业的时间(单位:min)依次为)依次为:75,80,85,65,95,100,70,55,65,75,85,110,120,80,85,80,75,90,90,95,70,60,60,75,90,95,65,75,80,80.该校的学生中作业时间超过一个该校的学生中作业时间超过一个半小时(含一个半小时)的学生有半小时(含一个半小时)的学生有_人人.6302021/8/8 星期日3512.频率分布直方图中各小长方体的面积频率分布直方图中各小长方体的面积和为和为_.12021/8/8 星期日362021/8/8 星期日37