《2022年统计学基础教案 .pdf》由会员分享,可在线阅读,更多相关《2022年统计学基础教案 .pdf(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 导读1.介绍教材统计学,李金昌主编,北京: 机械工业出版社, 2007第 1 版平时成绩考勤、作业、课程论文 、考试成绩A. 平时占 30-40%:(1) 完成作业四次,课程论文分解,占10%;(2) 形成课程论文及 PPT 讲解,按完成质量给分,占10% ;(3) 登录统计学精品课程网站::/tjx.lsu.edu /; “ 互动交流 ” ,表达对某一统计问题理解(300 字以上 );务必注明班级及,占10%;(4) 期中测验 (随机事件 ),假设事件发生,占10% . B. 期末闭卷考试 (或考查 )占 60-70%。4.本课程教学改革整体思路: 整体思路:课堂理论教学 -社会实践调查
2、 -课堂小组讨论:具体安排:第 1 周-第 3 周:总体安排、自由分组、选题:完成作业1(调查方案 ) 第 4 周-第 6 周:选题、方案设计、问卷设计:完成作业2(调查问卷 ) 第 7 周-第 9 周:开展实地调查、数据整理:完成作业3(描述性统计分析 ) 第 9 周-第 14 周:数据处理、结论探讨:完成作业(统计推断、模型预测 ) 第 14周-第 18周:课堂小组讲解、小组讨论第一章总 论精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 49 页2 教学目的: 理解统计的含义与本质; 对统计学产生与发展的简要历史,特别是对主要学派有
3、所了解; 比较全面地认识统计学的学科性质和作用;熟知统计数据的各种类型、特征以及计量尺度,掌握统计数据的研究过程和基本方法;对总体、个体、样本、标志、变量、指标和指标体系等统计学的基本概念有比较系统、全面的掌握。教学重点 :理解统计的含义与本质 ; 总体、个体、样本、标志、变量、指标和指标体系等统计学的基本概念有比较系统、全面的掌握教学难点:1. 统计学的涵义2. 统计学的性质3. 统计学中几个重要的概念教学课时 :3 课时课堂方法设计 :介绍统计学产生历史及思想, 分析统计学及方法的用处, 以案例、课程论文、选题激发学生的学习积极性;进一步理解统计的基础知识、概念和思想。教学过程:第一节什么
4、是统计学一统计的含义与本质1统计的含义及其关系:a) 统计数据: 二手资料和原始数据;经过观察、调查所取得具有信息价值的数字资料b) 统计活动 :即统计实践活动,是对统计数据进行搜集、整理和分析的全过程c) 统计学: 理论概括和总结。 “ 收集和分析数据的科学和艺术” 。统计学是一门关于数据资料的收集、整理、分析和推断的科学。复旦大学统计规律案例分析。2. 统计的本质: 关于为何统计,统计什么和如何统计的思想。二统计学的产生和发展1古典统计学时期:1亚里斯多德撰写 “ 城邦政情 ” 或“ 城邦纪要 ”精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第
5、2 页,共 49 页3 2英国威廉 配第 W.petty,1623-1670) , 政治算术政治经济学之父3英国约克大学约翰 格朗特 John Graunt ,1662 年,出版关于死亡率的自然观察和政治观察 。被称为统计学的创始人,政治算术学派的代表。2 近代统计学时期统计分析科学数理统计学派:创始人和代表人物,比利时凯特莱L.A.J.Quetelet,1796-1874),现代统计学之父。雅各布 伯努利 (Jacob Bernoulli)(16541705)荷兰人;1713年出版猜度术,给出“ 伯努利数 ” 、“ 伯努利大数定律。贝叶斯 (Thomas R. Bayes, 17021761
6、)英国数学家。首先将归纳理论法用于机率理论,创立贝叶斯统计理论。费歇尔 Fisher,18901962伟大的英国统计学家、数理统计学最主要的奠基者由费歇尔所确立的统计推断理论,样本分布理论, 试验计划法及分布理论对奠定 20世纪统计学的基础理论作出了很大的奉献3现代统计学时期小样本思想、 t 分布理论、卡方分布、方差分析、假设检验、估计理论、误差理论、决策理论、多元统计、时间序列、面板数据等方法的出现医学统计学、天文统计学、传媒统计学、管理统计学、金融统计学、国民经济统计学、社会统计学、教育统计学、心理统计学、生物统计学等学科的出现三、统计学的学科性质1研究对象数量性: 统计研究对象是客观事物
7、的数量方面总体性:社会经济统计认识社会经济现象时,主要是研究社会经济现象的总体数量规律,即通过大量的观察,获得足够多的统计资料,说明、认知总表达象的变化情况及规律。差异性:就是要从所研究现象总体的各个个体之间的差异中概括出共同普遍的特征,并对差异情况作出必要的反映2学科地位方法性:统计学是一门方法论科学, 其任务是为研究现象的数量提供科学的理论、原则和方法,就是提供工具和手段。层次性:统计学是一门一级学科,拥有完整、严密的学科体系,具有很强的精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 49 页4 层次性,其二级学科包括理论统计学、应
8、用统计学、 统计学史和统计学其他学科等。通用性:统计学是一门通用的方法论科学,其一般的理论、 原则和方法在任何研究数量的领域均可用。3构成内容描述性 :研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示, 进而通过综合、 概括与分析得出反映客观现象的规律性数量特征。推断性 :研究如何通过样本数据去推断总体数量特征。是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。四统计学的作用一统计学为我们认识自然、认识社会提供了必需的方法和途径二统计学在指导生产活动中发挥着重要作用三统计学在社会经济管理活动中的作用更显著四统计学为科学研究提供了有力
9、手段第二节 统计数据类型与研究方法一统计数据类型1按照所采用的计量尺度不同,可以分为定性数据与定量数据定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据两种。定类数据:按照事物的某种属性对其进行平行的分类或分组所形成的数据。定序数据:对事物之间等级或顺序差异测度所形成的数据。定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种定距数据:对事物类别或次序之间间距的测度所形成的数据。定比数据比率尺度:是能够测算两个测度值之间比值的数据。2按照其表现形式不同,可以分为绝对数、相对数和平均数绝对数:反映现象或事物绝对数量特征的数据
10、,它以最直观、最基本的形式表达现象或事物的外在数量特征,有明确的计量单位。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 49 页5 相对数:反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的比照来表达现象事物内部或现象事物之间的联系关系,其结果主要表现为没有明确计量单位的无名数,少部分表现为有明确计量单位的有名数限于强度相对数。平均数:反映现象或事物平均数量特征的数据,表达现象某一方面的一般数量水平。3按照其来源不同,可以分为观测数据与实验数据4按照其加工程度不同,可以分为原始数据与次级数据5按照其时间或空间状态不同,可以
11、分为时序数据与截面数据二统计数据研究过程包括四个基本环节:1.统计设计:制定统计数据研究方案2.数据搜集:按照统计设计的要求,有针对地获取所需的统计数据的环节,也称为统计调查环节3.数据整理:通过统计观测或实验所获得的原始数据,进行必要的系统化处理,使之条理化、综合化,成为能反映总体特征的统计数据的环节4.数据分析与解释:数据分析是在数据整理的基础上,围绕统计设计所确定的研究任务, 运用各种统计方法对数据进行各种统计分析,得出某些有用的定量结论的环节三统计数据研究方法基本方法有五种:1.大量观察法:大数定律2.统计分组法:传统分组法、判别分析法和聚类分析法等3.综合指标法:常见的综合指标有总量
12、指标、相对指标和平均指标4.统计推断法:根据概率论和样本分布理论,由样本观测数据来推断总体数量特征参数估计或假设检验5.统计模型法:建立回归模型、相关模型等第三节统计学的基本概念一总体与样本精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 49 页6 1总体: 统计研究的客观对象的全体,是具有某种共同性质的事物所组成的集合体也称为母体1总体的含义与特征大量性、同质性和差异性三个特征2总体的分类a)总体单位是否有限 有限总体和无限总体要检验一批灯泡的寿命 有限总体要全面考察该企业生产的灯泡的寿命无限总体b)总体存在形式 具体总体和抽象总体今
13、天来上统计学的所有学生总体具体总体某种工艺条件下生产的产品形成的总体抽象总体c)总体单位是否能计数 可计数总体和不可计数总体d)总体单位是否人为划分 自然总体和人为总体自然确定:个人、企业、家庭等自然形成的总体人为划定:一公斤小麦、一百公斤小麦、一吨小麦等人为划分的总体;一公顷草地、一百公顷草地、一平方公里草地等人为形成的总体。3个体的含义: 构成统计总体的个别事物称为个体也称总体单位4总体与个体的关系a.) 总体容量随着个体数的增减变化b.) 随着研究目的不同,总体中的个体可发生变化c.) 随着研究范围的变化,总体与个体的角色可以变换2样本 :1样本的含义: 所谓样本就是从总体中抽取一部分个
14、体所组成的集合,也称子样。2样本与总体的关系a.) 样本是总体的代表和缩影b.) 样本是用来推断总体的c.) 总体和样本的角色是可以改变的二标志和变量1标志精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 49 页7 1标志的含义: 所谓标志,就是用以描述个体所具有的特征的名称。标志在每个个体上的具体表现结果称为标志表现。2标志的种类:a)按其结果表现方式不同品质标志:只能用文字表示; 数量标志:用数值表示的。b)按其在每个个体上表现的结果是否相同:不变标志:在每个个体上的标志表现完全相同; 可变标志:在每个个体上的表现不尽相同。c)按其
15、表现个体的直接程度不同:直接标志:直接表现个体特征的标志; 间接标志:间接表现个体特征的标志。2变量1变量的含义 :a.) 狭义:可变的数量标志。b.) 广义:变量是可变的数量标志和可变的品质标志。2变量的分类: a) 按其反映数据的计量尺度不同,可以分为定性变量和定量变量b) 按其所受的影响因素分:确定性变量和随机变量。c) 按其变量值的变化是否连续:连续性变量和离散性变量。三统计指标和指标体系1 统计指标1含义:反映社会经济现象总体数量特征的概念及其具体数值a.) 说明总体数量特征的 ; b.) 有广义与狭义之分广义:说明总体数量特征的概念和数值。包括六个基本要素狭义:说明总体数量特征的概
16、念和名称。包括三个基本要素c.)注意问题:指标都必须用数字表示。2统计指标与标志的关系区别: a.)研究对象不同 ; b.)表现形式不同 . 联系: a.)依据与结果 ; b.)相互转化。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 49 页8 3统计指标的种类a.)按计算范围分:总体指标和样本指标总体指标也称总体参数,是惟一的但往往未知;样本指标也称样本统计量,是可知的但非唯一。b.) 按反映现象的内容分:数量指标和质量指标数量指标也称为总量指标, 按照其反映现象内容的不同, 分为总体标志总量和总体容量,按照其反映现象时间状况的不同
17、,分为时期指标与时点指标。质量指标分为相对指标和平均指标, 相对指标反映事物内部或相关事物之间相对数量关系,包括:结构相对指标总体中部分总量与总体总量之比比例相对指标总体中某部分总量与其他部分总量之比比较相对指标两个同类指标之比动态相对指标同一指标在不同时间之比强度相对指标两个性质不同但有联系的总量指标之比计划完成程度相对指标实际指标与计划指标之比平均指标是反映变量分布集中趋势或中心位置的指标,说明变量的一般数量水平,包括算术平均指标、几何平均指标、调和平均指标、众数指标和中位数指标。c.) 按反映的时间分:静态指标和动态指标。4统计指标的设计 :对指标的名称和涵义、计算范围和方法、资料搜集和
18、统计量化、计量单位等进行具体规定。5总体与个体、指标与标志的关系总体由个体组成,指标是由标志构成2指标体系反映同一总体或样本多个方面数量特征的一系列相互联系的统计指标所形成的体系,成为统计指标体系。1含义: 假设干统计指标组成,互相制约有机整体。2形式: 数学等式关系、相互补充关系、因果关系、相关关系。3指标体系的设计: 目的性原则、科学性原则、可行性原则、灵活性原则、层次性原则、联系性原则、协调性原则精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 49 页9 本章总结: 本章是学习统计学的入门章节,篇中涉及了大量的概念性知识,并且相对
19、容易混淆, 希望同学们在课后要认真复习这些基础知识,为我们学习以后各章打好基础,练习主要完成学习指导和我刻印的习题,复习教材的“本章小节”,将其系统化,理解再记忆。作业布置: 习题第一题、第二题、第三题1,3,7,9,10小题。第二章统计资料的收集、整理与显示教学目的: 本章阐述统计数据收集、整理与显示的理论方法,理解统计数据收集的含义和要求,熟悉统计数据收集的各种方式、方法,掌握统计整理得而理精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 49 页10 论和方法,包括分组,和统计表格的设计,了解统计图的意义,统计数据整理与显示中的应用
20、。教学重点 : 1. 统计数据收集以及收集几种方法。2. 设计统计调查方案的方法。3. 统计数据分组的类型原则和方法。4. 分组的方法,统计分布的编制。掌握 Excel 的相关应用。教学难点: 1. 几种调查方法的特点和应用。 2. 统计收集的方法之间的区别与联系。3. 了解统计表的编制。教学课时:8 学时教学方法设计: ;练习与新课相结合,例如加以稳固。教学过程:第一节统计数据的收集一、统计数据收集的含义和要求统计数据收集是整个统计活动的基础阶段,通常也称为统计调查阶段。统计数据收集的基本要求是准确性、及时性和完整性。二、统计数据收集方案设计统计数据收集方案应包括以下一些内容:数据收集目的、
21、 数据及其类型、数据收集对象和观测单位、观测标志和调查表、数据收集方式与方法、 数据所属时间和数据收集期限、数据收集地点和数据收集的组织。三、统计数据收集方式统计数据收集方式有两种:统计调查方式和实验方式。一统计调查方式统计调查就是按照预定的统计任务,运用科学的统计调查方法, 有计划有组织地向客观对象搜集资料的过程。1、普查精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 49 页11 概念:根据特定的统计研究目的而专门组织的一次性的全面调查,用以收集所研究现象总体的全面资料。组织方式:a)专门组织普查机构调查;b)利用现有统计资料;基
22、本原则:a)标准时点防止重复和遗漏b)调查步骤同一次调查在不同阶段统一性原则c)指标口径内涵d)调查时间起止e)普查周期:我国为期十年的普查制度2、抽样调查抽样调查是一种非全面调查, 就是从总体中抽取样本, 以样本推断总体的统计调查方式。抽样调查是目前我国应用最广泛的统计调查方式。抽样调查可分为概率抽样和非概率抽样两类。你觉得的 “ 随机” 和“ 随意” 有区别吗?1概率抽样a概率抽样是按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来。b特点:在样本的抽取上遵循随机原则在调查的功能上能以部分推断总体在推断的手段上运用概率估计的方法在推断的理论上,以大数定律和中心极
23、限定理为依据在推断的效果上,抽样误差可以计算并加以控制c概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样两种。重复抽样的特点是:总体的每个个体都有数次被抽中的可能性,次抽样之间相互独立。不重复抽样的特点是: 总体中每个个体都只有一次被抽中的可能性,次抽样之间不相互独立d概率抽样从抽样组织形式上看,可分为简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样五种。简单随机抽样是抽样调查最基本的组织形式,具体的样本抽取方式有抽签法精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 11 页,共 49 页12 和随机数表法等;分层抽样特点是必须具备总体所
24、有个体的名录和至少一个分层标志的全面资料,各层的抽样相互独立,尽量把总体差异通过分层而转化为层间差异;等距抽样的特点依固定的间隔和规定的顺序来抽取个体,属于不重复抽样;整群抽样要尽量把总体差异转化为群内差异等,一般属于不重复抽样; 多阶段抽样特点是整群抽样和分层抽样两种组织形式的综合。2非概率抽样非概率抽样是非随机抽样调查, 是凭人们的主观判断或根据便利性原则来抽取样本。有任意抽样、典型抽样、定额抽样和流动总体抽样等几种。任意抽样, 也称随意抽样,即抽样者随意地或任意地通常是遵循简便性原则从总体中抽取样本。典型抽样,也称有目的抽样、代表性抽样,即抽样者根据自己的知识、经验和判断从总体中挑选出
25、“ 典型的 ” 或“ 有代表性 ” 的单位来组成样本。定额抽样也称配额抽样, 抽样者按照规定的定额获得一个在某些特征上与总体结构大致成比例的样本。 它是先对总体按一定标志分类,并按比例分配每类应调查单位的定额,然后由抽样者在每类进行判断抽样。流动总体抽样,也称 “ 捕获标记再捕获 ” (Capture -Tag-Recapture) 抽样,即抽样者先从流动总体中获取部分单位,加以标记后放回总体, 过一段时间后再获取部分单位, 然后根据再获取单位中有标记单位的比例来推算总体的数量。3、重点调查重点调查是对数据收集对象总体中的部分重点个体进行观测的统计调查方式。特点:以客观原则来确定观测单位;属于
26、范围较小的全面调查。关键是选择重点单位确定最低标志值确定最低重点单位累计标志值比重4、统计推算统计推算的概念和特点; 统计推算方法。 统计推算是以已掌握的各种统计数精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页,共 49 页13 据为基础, 根据事物之间的内在联系或发展规律,对被研究现象数量特征做出估算或测算的一种间接统计调查方式;例如插值法、平均值估计法等。二实验方式含义:所谓实验方式,就是运用自然科学的试验法,通过观测人为安排条件下试验产生的各种结果并加以记录的方式来获取数据,或通过人为安排条件下的试验来探求某个或某些因素对所研究事物
27、的数量影响程度和作用方式,凭借实验结果来揭示所考察因素与所研究事物之间的数量因果关系。原则:均衡分散性原则;整齐可比性原则常用的实验设计:1完全随机试验2随机区组试验3拉丁方试验4正交试验三数据收集误差数据收集误差存在两种误差:观测性误差和代表性误差。观测性误差也叫登记性误差或调查性误差,在全面调查和非全面调查中都会产生,是一种非一致性误差; 代表性误差是指在抽样调查中,因样本不能完全代表总体而产生,又分为系统性代表性误差和偶然性代表性误差两种。四、统计数据收集方法统计数据收集方法, 是指获取被调查对象数据的渠道或途径,常用的方法有直接观察法、通讯法、采访法、登记法等几种。五、问卷设计问卷是依
28、据统计研究目的和要求,按照一定的理论假设设计出来的、由一系列问题、项目、备选答案及说明所组成的、向被调查者搜集资料的一种工具。问卷一般由引言、被调查者基本情况、问题和答案、结语四个部分组成。设计时应考虑三个方面问题:问题的编排顺序;提问方式和措辞要点; 问卷调查说明等。引言和注释(WWH 三原则 ) 首先 要说明调查者的身份 who其次 要说明调查的大致内容和进行这项调查的目的(why) 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 49 页14 最后 要说明调查对象的选取方法和对调查结果保密的措施 (how) 问题设计的原则1、所
29、列问题必须符合客观实际情况2、问题不能太多3、问题必须是被调查者有能力答复的4、不要直接提社会上禁忌的和敏感性的问题5、问题不能带有诱导性6、问题的内容要具体、单一7、问题的语言要简单易懂、标准标准8、问题的排列要讲究逻辑性第二节统计数据的整理一、统计整理的含义与要求统计整理的 含义 :统计资料整理是根据统计研究的目的,按照统计整理方案的要求,对统计调查所得到的大量的原始资料进行科学的加工、汇总、或对已经加工过的资料进行再加工,使之系统化、条理化、成为能够反映总体特征的综合资料的工作过程1) 依据:研究目的;2) 内容:原始资料、次级资料 ; 3) 目的:反映个体的资料转化为反映总体的资料。4
30、) 意义:调查的继续,分析的基础。要求:科学性、条理性和充分性。二、统计整理的内容和步骤分组、汇总、编表图 ,其中汇总是中心内容:根据研究任务的要求,选择应整理的指标,并根据分析的需要确立具体的分组。对统计资料进行汇总,计算。 使用统计图表描述汇总计算的结果。统计整理的步骤:设计整理方案精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页,共 49 页15 统计资料的审核进行科学的统计分组统计汇总编制统计图表三、统计分组一 含义与性质统计分组是根据事物内在的特点和统计研究的任务,按一定的标志,将统计总体划分为假设干个不同的类型或部分组的一种统计
31、方法。 分组之后应保持组内资料的同质性和组间资料的差异性。统计分组的关键 选择分组标志。二统计分组的种类a.) 按分组标志性质分:品质标志分组和数量标志分组b.) 按分组标志多少:简单分组和复合分组。四、分布数列一分布数列的概念和种类1分布数列的概念:在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分布数列, 也称为统计分布或次数分布。分布数列的组成要素:总体按某标志所分的组(组别)和分配在各组的单位数(频数)及各组单位数占总体单体数的比重(频率) 2分布数列的 种类a)品质数列b)变量数列单项数列组距数列等距数列异距数列3分布数列的构成:a ) 组别b
32、 )分配在各组的单位数。二分布数列的编制1、单项数列a)概念 单一变量值为一组 ; 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页,共 49 页16 b)适用范围 :变动范围不大的离散变量和取整数的连续变量。c)编制步骤:确定组数; 把总体单位分配在相应各组。2、组距数列a) 概念以区间表示一个组 ; b) 适用范围:连续变量、变动范围大的离散变量; c) 步骤:确定组距、组数;确定等距或异距;确定组限 ;算组中值。 . 3、组距数列编制中应该 注意 的问题a) 组距和组数:组距的概念;组数的概念;关系b) 组限确实定:组限的概念、确定的
33、方法、确定的原则;c) 等距数列或异距数列的选择消除不可比因素的方法:次数密度d.) 组中值计算:作用、计算条件、计算方法、注意问题:开口组三 频率分布1频率分布的性质:频率在0 到 1 之间;各频率之和等于1 2频率分布图:3累计频率的计算:a) 累计频率的概念:累计频数和累计频率;累计频率计算的方法; b) 向上累计和向下累计向上累计是将各组频数 率 曲线标志值低的组向标志值高的组依次累计,说明至某组上限以下的各组频数率累计分布状况。向下累计是将各组频数 率由标志高的组向标志值低的组依次累计,说明至某组下限以上各组频数率累计分布状况。第三节统计数据的显示一、 统计表一概念经过汇总,得到一系
34、列总量指标的数字资料,把这些数字按一定的逻辑顺序在表格上表现出来,这种表称为统计表。广义上看, 任何用以反映统计资料的表格都是统计表。 统计表是表现统计资料的最常用的形式,也是统计分析的重要工具。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 16 页,共 49 页17 二 结构统计表的结构从外表形式看,由总标题、横行标题和纵栏标题、指标数值等部分构成。 1、从内容看:主词、宾词2、从形式看:总标题、横行标题、纵栏标题、指标三 种类简单表 未分组资料;分组表 按一个标志分组;复合表 两个以上标志并层叠分组。二、统计图1.直方图:用矩形的宽度和高度来
35、表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布。2.折线图:折线图也称频数多边形图(Frequency polygon),是在直方图的基础上,把直方图顶部的中点(组中值 )用直线连接起来,再把原来的直方图抹掉,折线图的两个终点要与横轴相交。3.曲线图: U 型分布是一种刚好与钟型分布相反的分布,其标准是越靠近中心变量值,分布次数越少;越远离中心变量值则分布次数越多。形成“ 中间小,两头大 ” 的分布特征。象英文的 “U ”字。J型分布的特征有正反两种情况,一种是次数随变量的增大而逐渐增多,称为正 J形分布;假设次数随变量值的增大反而减少,则称为反J 型分布,象英文的 “J”字。4
36、.茎叶图和箱形图的含义和编制方法。A.用于显示未分组的原始数据的分布B.由“ 茎” 和“ 叶” 两部分构成,其图形是由数字组成的C.以该组数据的高位数值作树茎,低位数字作树叶D.对于 n(20 n300)个数据,茎叶图最大行数不超过L = 10 log 10 n E.茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值, 保留了原始数据的信息5.雷达图:先做一个圆,然后将圆P等分,得到 P个点,令这 P 个点分别对精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - -
37、-第 17 页,共 49 页18 应 P 个变量,在将这P 个点与圆心连线,得到P 个幅射状的半径,这P 个半径分别作为P 个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示。再将同一样本的值在P个坐标上的点连线。这样, n 个样本形成的 n 个多边形就是一个雷达图。本章总结: 1. 统计收集的内容和方法、统计调查的组织。整理的方法及技术和统计表。作业布置: 习题第三题 1, 9, 10题。第三章变量分布特征的描述教学目的: 理解变量分布的三大特征, 即集中趋势、离中趋势和分布形状的含义;理解平均指标、 离散指标和形状指标的意义与作用,熟练掌握各种平均数、精选学习资料 - - - -
38、 - - - - - 名师归纳总结 - - - - - - -第 18 页,共 49 页19 各种离散指标的计算方法并加以应用。教学重点 :理解变量分布的三大特征, 即集中趋势、离中趋势和分布形状的含义。掌握各种平均数、 各种离散指标的计算方法。 掌握偏系数和峰度系数的计算方法。教学难点: 熟练各种平均数、离散指标的计算方法,了解区别和联系。教学课时: 5 学时教学方法设计: 例如法、软件演示法、教案法第一节集中趋势的描述学习要求:理解变量分布三大特征即集中趋势、离中趋势和分布形状的的含义;理解平均指标、离散指标和形状指标的意义与作用;熟练掌握各种平均数的计算方法并加以正确的应用,科学理解加权
39、平均数中权数的意义,正确认识算术平均数与调和平均数之间的应用关系,以及算术平均数、中位数和众数三者之间的数量关系;熟练掌握各种离散指标的计算方法并加以正确的应用,尤其是要深刻理解方差、标准差和离散系数的内涵;熟练掌握偏度系数和峰度系数的计算方法并加以正确的应用,尤其是要了解动差的含义。变量分布特征可以从以下三个方面加以描述:集中趋势:反映变量分布中各变量值向中心值靠拢的程度;离中趋势:反映变量分布中各变量值远离中心值的程度;分布形状:反映变量分布的偏斜程度和尖陡程度。一、集中趋势与平均指标集中趋势亦称为趋中性,是指变量分布以某一数值为中心的倾向。用平均指标来反映,平均指标的种类。平均指标主要用
40、来说明同质总体中某一标志值,在一定时间、 地点条件下所到达的一般水平。其数值表现平均数。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 19 页,共 49 页20 数值平均数: 从总体各单位变量值中抽象出具有一般水平的量,这个量是根据各个单位的具体标志值计算出来的,有算术平均数、调和平均数、几何平均数等形式。数值平均数包括:算术平均数 :简单算术平均加权算术平均调和平均数:简单调和平均加权调和平均几何平均数:简单几和平均加权几和平均位置平均数: 先将总体各单位的变量值按一定顺序排列,然后取某一位置的变量值来反映总体各单位的一般水平。位置平均数有众数
41、、中位数、四分位数等形式位置平均数包括:众数中位数分位数平均指标的作用:1通过反映变量分布的一般水平,帮助人们对研究现象的一般数量特征有一个客观的认识。2利用平均指标可以对不同空间的发展水平进行比较。3利用平均指标可以对某一现象总体在不同时间上的发展水平进行比较,以说明这种现象发展变化的趋势或规律性。4利用平均指标可以分析现象之间的依存关系或进行数量上的推算。5平均指标还可以作为研究和评价事物的一种数量标准或参考。二、数值平均数一算术平均数算术平均数一般就称为平均数mean 。其定义是:观察值的总和除以观察值个数的商。在实际工作中,由于所掌握的统计资料的不同,利用上述公式进行计算时,可分为简单
42、算术平均数和加权算术平均数两种。1、基本计算公式:总体标志总量/总体单位总数2、简单算术平均数:简单算术平均数的公式根据未经分组整理的原始数据计算的均值。设一组数据为x1,x2,x3,xn。则简单算术平均数的计算公式如下:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 20 页,共 49 页21 1计算公式 :2适用范围 :末分组 资料。3、加权算术平均数:根据分组整理的数据计算的算术平均数1计算公式:2注意点3适用范围 :分组资料中已知分母加总资料。4注意问题 权数及权数的作用-算术平均数的大小,不仅取决于研究对象的变量值(x),而且受各变量值重
43、复出现的频数 f或频率 ff大小的影响,频数或频率较大,该组数据的大小对算术平均数的影响就大,反之则小。4、算术平均数的数学性质(1)各变量值与其算术平均数的离差之和等于零. (2)各变量值与其算术平均数的离差平方和最小. (3)两个独立的同性质变量代数和的平均数等于各变量平均数的代数和. (4)两个独立的同性质变量乘积的平均数等于各变量平均数的乘积. 5、算术平均数的优缺点 : 优点 : a.)可推算总体标志总量 ; b.)便于代数运算 ; c.)抽样中具有良好稳定性。缺点:a.)受极端值的影响大 ; b.)组距数列中有较大假设性。二调和平均数1问题的提出例:市场上苹果的价格有三种:3 元/
44、斤;元 /斤元/斤,现有两种可供选择的方案:甲各买 30 元或乙各买 15 斤,问选择何方案为优?)(212211ffxffffxfxfxfxfxkkk加权算术平均数:nxx简单算术平均数:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 21 页,共 49 页22 2调和平均数的概念1 概念:标志值倒数的算术平均数的倒数。调和平均数是变量值倒数的算术平均数的倒数。 又称倒数平均数。 调和平均通常是作为算术平均数的变形来使用的。但一些特殊的领域, 如综合评价,调和平均却是一种独立的统计平均数,有着特定的应用价值。2 特点: a ) 常作为算术平均数的
45、变形b) 标志值中有数据为零 时无法计算。3简单调和平均数适用范围 :末分组资料。4加权调和平均数实质:加权算术平均数的变形。调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。 只要有一个变量值为零, 就不能计算调和平均数。当组距数列有开口组时, 其组中值即使按相邻组距计算了,假定性也很大,这时,调和平均数的代表性就很不可靠。调和平均数应用的范围较小。适用范围:分组资料已知基本公式分子加总资料。三由相对数或平均数计算平均数基本步骤 :1.)写出基本公式 ; 2.)确定计算公式 ; 3.)具体计算。四几和平均数几何平均数也称几何均值,它是n 个变量值乘积的 n 次方根。适用对象:
46、 现象的总比率是假设干项变量的乘积,或现象的总发展速度是各时期发展速度的连乘积时,计算平均比率或平均发展速度。1、简单几和平均数:直接将n 项变量连乘,对其连乘积开n 次方根所得的平均数即为简单几何平均数。xnH1简单调和平均数:xMMH加权调和平均数:nnnxxxxG21简单几何平均数:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 22 页,共 49 页23 适用范围:资料末分组,变量值互相影响。2、加权几和平均数:与算术平均数一样,当资料中的某些变量值重复出现时,相应地,简单几何平均数就变成了加权几何平均数。适用范围:分组资料,变量值互相影响
47、。几何平均数特点:1受极端值的影响较算术平均数小。2如果变量值有负值,计算出的几何平均数就会成为负数或虚数。3仅适用于具有等比或近似等比关系的数据。4其对数是各变量值对数的算术平均数五算术平均数、调和平均数、几和平均数的数学关系1231231/11,.,.,()()nnpnpiiiniix xxxwwwwx wMpwMpp可以证明:为 的增函数。同一资料计算结果: xG H三、位置平均数位置平均数,就是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值,它对于整个总体来说,具有非常直观的代表性,因此,常用来反映分布的集中趋势。常用的众数、中位数。一中位数1、中位数的概念:总体单
48、位按某一标志值排队后中间位置的标志值。中位数是将数据按大小顺序排列起来,形成一个数列, 居于数列中间位置的那个数据就是中位数。2、中位数的计算确定中位数, 必须将总体各单位的标志值按大小顺序排列,最好是编制出变量数列。这里有两种情况:ffffffnffxxxxGnn212121加权几何平均数:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 23 页,共 49 页24 1末分组资料中位数的计算基本步骤: 1)将总体单位按某一标志进行排队;2)确定中数的位置: (n+1)/2 3)中间位置上的那个标志值即为中位数。121222ennnxnxxnM为奇数
49、)( 为偶数)(2分组资料中位数的计算基本步骤: 1.)计算累计频数 (向上累计频数或向下累计频数); 2.)确定中位数的位置: f/23.) 单项数列:该组的标志值即为中位数; 组距数列,根据上下限公式计算中位数。3中位数的特点:中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。3缺乏敏感性。二分位数1、概念将变量的数值按大小顺序排列并等分为假设干部分后,处于等分点位置的数值。常用的分位数有四分位数、十分位数和百分位数。LQ,
50、MQ和UQ分别表示第一个、第二个和第三个四分位数,则他们的位置分别为:14n,2(1)4n和3(1)4n,根据位置即可确定各个四分位数。三众数dfSfUMdfSfLMmmemme1122中位数:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 24 页,共 49 页25 1、众数的概念:众数是指总体中出现次数最多的那个标志值。用Mo 表示。它主要用于定类品质标志数据的集中趋势,当然也适用于作为定序品质标志数据以及定距和定比数量标志数据集中趋势的测度值。众数也不受数列中极端变量值的影响,它可反映总体各单位某一标志值的集中趋势。2、末分组资料众数的计算: