统计学教学案例集.pdf

上传人:asd****56 文档编号:74065637 上传时间:2023-02-24 格式:PDF 页数:46 大小:538.37KB
返回 下载 相关 举报
统计学教学案例集.pdf_第1页
第1页 / 共46页
统计学教学案例集.pdf_第2页
第2页 / 共46页
点击查看更多>>
资源描述

《统计学教学案例集.pdf》由会员分享,可在线阅读,更多相关《统计学教学案例集.pdf(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学精品课程建设小组统计学精品课程建设小组统计学精品课程建设小组统计学精品课程建设小组二二二二六年十一月六年十一月六年十一月六年十一月统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设2【案例一案例一】全国电视观众抽样调查抽样方案全国电视观众抽样调查抽样方案全国电视观众抽样调查抽样方案全国电视观众抽样调查抽样方案一、调查目的、范围和对象一、调查目的、范围和对象1 1.1.1 调查目的调查目的准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据

2、。1.21.2 调查范围调查范围全国 31 个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。1.31.3 调查对象调查对象全国城乡家庭户中的 13 岁以上可视居民以及 4-12 岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满 6 个月或预计居住 6 个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。二、抽样方案设计的原则与特点二、抽样方案设计的原则与特点2.12.1 设计原则设计原则抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有

3、代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。2 2.2.2 需要考虑的具体问题、特殊要求及相应的处理方法需要考虑的具体问题、特殊要求及相应的处理方法2 2.2.1.2.1 城乡区分城乡区分城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设3以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调

4、查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采用第二种处理方式。在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。2.22.2.2 2抽样方案的类型与抽样单元的确定抽样方案的类型与抽样单元的确定全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作

5、为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。本抽样方案采用分层五阶抽样。各阶抽样单元确定为:第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等);第二阶抽样:街道、乡、镇;第三阶抽样:居委会、村委会;第四阶抽样:家庭户;第五阶抽样:个人。为提高抽样效率,减少抽样误差,在第一阶抽样中对区、县采用按地域及类别分层。在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS 系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。2 2.2.3.2.3 自我代表

6、层的设立自我代表层的设立根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。这样自我代表层共有 8 个,包括以下城市与地区:统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设4北京市、天津市、上海市;广州市、成都市、长沙市、

7、西安市;西藏自治区。三、样本区、县的抽选方法三、样本区、县的抽选方法3.13.1 全国区全国区、县的调查总体县的调查总体根据 2001 年的全国行政区划资料,全国(港澳台除外)共有 787 个市辖区,此外有 5 个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同一个市辖区,则共有 792 个区;全国共有 1674 个县(包括自治县及旗、自治旗、特区与林区等)、400 个县级市,县级行政单位的总数为 2074 个,这中间包括福建省的金门县,不能进行调查,因此除金门县以外的所有 2865 个区、县(792 个区及 2073 个县)构成此次调查的调查总体。3 3.2.2 区区、

8、县分层县分层为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层。分层可以按多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量。在本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。关于这方面已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来分类。而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在省的人文发展指数及县的人均 GPT)的资料都无法得到,经过多方研究,我们对区县的分层按以下两种标识进行。(1)地域我国幅员广大,各地经济

9、、社会、文化与气候的地域差异极大,而所有这些因素都与电视观众的收视行为密切相关。我们首先将所有县按所在省(自治区、直辖市)的地理位置分成 3 大层 13 个子层,各省括号内的数字为它们的人文发展指数(HumanDevelopment Index,简称 HDI),在全国的排位,参见附表。地域分层如表 1:统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设5表表 1 1全国区、县的地域分层全国区、县的地域分层大层大层所含省、自治区、直辖市所含省、自治区、直辖市第一大层第一大层(东部地区)(东部地区)子层 10:上海(1)、北京(2)、天津(3)(每个都作为自我代表层)子层 1

10、1:辽宁(5)、山东(9)子层 12:江苏(7)、浙江(6)子层 13:福建(8)、广东(4)、海南(13)第二大层第二大层(中部地区)(中部地区)子层 21:黑龙江(10)、吉林(12)子层 22:河北(11)、河南(18)、山西(16)子层 23:安徽(20)、江西(23)子层 24:湖北(14)、湖南(17)第三大层第三大层(西部地区)(西部地区)子层 31:内蒙古(21)、新疆(15)、宁夏(26)子层 32:陕西(25)、甘肃(28)、青海(29)子层 33:重庆(22)、四川(24)子层 34:广西(19)、云南(27)、贵州(30)子层 30:西藏(自我代表层)需要说明的是以上划

11、分的层,还考虑了其他一些因素,各省按联合国制定的标准计算的人文发展指数仅是考虑因素之一。例如,按人文发展指数,广西(第 19 位)实际上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区,我们的划分与它一致,这样便于资料的汇总发布。又如海南,根据人文发展指数(第 13位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为而言,与广东、福建划在一子层内是合理的。(2)区、县类别同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区)和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程度有较大差异。我们将各大层中

12、所有的区、县除已划为自我代表层的以外,(如下称抽样总体)分成以下 5 类,每类组成 1 个小层:一类区,二类区,县级市,一类县,二类县。全国抽样总体中所有区县共分成 115=55 个小层。其中区的划分标准为区中非农业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;县的划分标准为人均国内生产总值,高的为一类县,低的为二类县。区县划分类别的标准在三统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设6大层中各不相同,具体标准如下:区类别的划分标准:东部地区与中部地区:非农人口在总人口中的比例大于或等于 80%为一类区,小于80%为二类区;西部地区:非农人口在

13、总人口中的比例大于或等于 70%为一类区,小于70%为二类区。县类别的划分标准:东部地区:人均 GDP 在 5000 元以上为一类县;5000 元以下为二类县。中部地区:人均 GDP 在 4000 元以上为一类县;4000 元以下为二类县。西部地区:人均 GDP 在 3000元以上为一类县;3000 元以下为二类县。3.3.3 3 自我代表层的区、县情况自我代表层的区、县情况根据最新行政区划,自我代表层中的 7 个城市所辖的区、县构成情况如表 1。表表 2 2 2 2自我代表城市的辖区、县构成自我代表城市的辖区、县构成城城 市市一类区一类区二类区二类区直辖市中的县直辖市中的县及其它县级市及其它

14、县级市县县总计总计北京市855-1818天津市774-1818上海市973-1919广州市552-1212成都市52481919长沙市23139 9西安市44051313西藏自治区包括 1 个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)及 71 个县。3.43.4 抽样总体区县情况抽样总体区县情况按 3.2 划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在(抽样总体)总人口中的比例如表 3 与表 4 所示。统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设7表表 3 3抽样总体中各小层的区县数抽样总体中各小层的区县数地域子层地域子层一类区一类区

15、二类区二类区县级市县级市一类县一类县二类县二类县合计合计东部地区 114362471968239239239239东部地区 123047533137198198198198东部地区 132441515942212121217 7 7 7中部地区 215626403632190190190190中部地区 22396756140148450450450450中部地区 232634193195205205205205中部地区 242044394269214214214214西部地区 31278349161221221221221西部地区 3211161551131224224224224西部地区 3

16、3542145585201201201201西部地区 3419273074175325325325325合计300300300300414141414 4 4 43983983983986296296296299439439439432682682682684 4 4 4表表 4 4抽样总体各小层人口占总人口的比例(抽样总体各小层人口占总人口的比例(%)地域子层地域子层一类区一类区二类区二类区县级市县级市一类县一类县二类县二类县合计合计东部地区 111.35122.27663.17280.76723.629511.1972东部地区 120.69921.64873.88321.41052.280

17、99.9226东部地区 130.50831.21873.44372.34971.71509.2354中部地区 211.02000.50231.77091.10351.00375.4004中部地区 220.92631.91282.78584.52916.359316.5133中部地区 230.52721.18001.06821.16374.93858.8776中部地区 240.61061.59282.54152.27573.251910.2726西部地区 310.43430.22190.73191.22651.36923.9838西部地区 320.29760.55130.42570.72333.

18、05675.0546西部地区 330.14542.11320.95811.87153.89618.9843西部地区 340.36290.94781.32542.64995.272210.5582合计6.883114.166222.107220.070536.7730100.0000统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设83.3.5 5 区、县的抽样方法及样本量区、县的抽样方法及样本量抽样总体中各层(指小层,下同)内对区、县的抽样采用按人口的 PPS 系统抽样,样本量一般为 2;少数人口较多的小层样本量定为 3。样本量的具体分配见表5。样本区、县总量为 121

19、个。表表 5 5各小层的区县样本量的分配各小层的区县样本量的分配四、抽样总体中四、抽样总体中样本区、县内的抽样方法样本区、县内的抽样方法4.14.1 样本区内的抽样样本区内的抽样每个一类样本区内采用街道(镇)、居委会、家庭户及个人的 4 阶抽样;每个二类样本区内采用街道(乡、镇)、居(村)委会、家庭户及个人的 4 阶抽样,样本量皆为 90。具体方法如下。4 4.1.1.1.1 对街道(乡、镇)的抽样对街道(乡、镇)的抽样样本区内对街道(乡、镇)抽样采用按人口的 PPS 系统抽样,每个样本区抽 3 个街道(乡、镇),其中一类区不抽乡。地域子层地域子层一类区一类区二类区二类区县级市县级市一类县一类

20、县二类县二类县合计合计东部地区东部地区东部地区东部地区 11111111233221212东部地区东部地区东部地区东部地区 12121212223221111东部地区东部地区东部地区东部地区 13131313223221111中部地区中部地区中部地区中部地区 21212121222221010中部地区中部地区中部地区中部地区 22222222223331313中部地区中部地区中部地区中部地区 23232323222231111中部地区中部地区中部地区中部地区 24242424222221010西部地区西部地区西部地区西部地区 31313131222221010西部地区西部地区西部地区西部地区

21、32323232222231111西部地区西部地区西部地区西部地区 33333333222231111西部地区西部地区西部地区西部地区 34343434222231111合计合计合计合计2222232326262 23 32727121121统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设94 4.1.2.1.2 对居委会的抽样对居委会的抽样样本街道、镇(乡)内对居(村)委会的抽样采用按人口的 PPS 系统抽样,每个样本街道、镇、乡各抽 2 个居(村)委会(其中一类区不抽村委会)。为操作方便,这里的人口数也可用户数。4 4.1.3.1.3 对家庭户的抽样对家庭户的抽样样

22、本居(村)委会内对家庭户的抽样采用随机起点的等概率系统抽样,即等距抽样。每个居(村)委会固定抽取 15 户。在抽样时,必须首先清点居(村)委会管辖范围内的实际家庭户数,且规定排列的顺序。4 4.1.4.1.4 样本户内具体调查对象的确定样本户内具体调查对象的确定对每个被抽中的样本户,在 13 岁以上(含 13 岁)的成员中,完全随机地确定一名为具体调查对象。为确保家庭成员中的每一个这样的成员都有相等的概率被抽中,采用二维随机表来确定。表表 6 6确定户内调查对象的二维随机表确定户内调查对象的二维随机表序号姓名性别年龄123456789101112111111111111122121122112

23、1233211322131234413223143241554123412354266315243514627714362525743884571263753199514382765281010359417286941111615104983276121272941161831054.24.2 样本县(县级市)内的抽样样本县(县级市)内的抽样每个样本县内采用乡(镇)、村(居)委会、家庭户及个人的 4 阶抽样,样本量为60。具体方法如下。统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设104 4.2 2.1.1 对乡、镇的抽样对乡、镇的抽样确定县城所在的镇(城关镇)为必调

24、查镇,对其余乡(镇)采用按人口的 PPS 系统抽样,再抽 2 个乡(镇),每个样本县共调查 3 个乡(镇)。4 4.2 2.2.2 对村(居)委会的抽样对村(居)委会的抽样在每个城关镇中用按人口 PPS 抽样抽取 2 个样本居(村)委会。对其它两个样本乡、镇内,也用同样的方法抽 2 个村委会。为操作方便,这里的人口数也可用户数。4 4.2 2.3.3 对家庭户的抽样对家庭户的抽样样本村(居)内对家庭户的抽样与样本居委会内对家庭户的抽样完全相同,仍采用随机起点的等概率系统抽样,即等距抽样。每个村(居)固定抽取 10 户。4 4.2 2.4.4 具体调查对象的确定具体调查对象的确定在样本户中确定具

25、体对象的方法与4.1.4.1.4 4中情形完全相同,即用二维随机表来确定。4.34.3 儿童样本的确定儿童样本的确定在城乡每个样本户中,除抽取一位 13 岁以上的观众作为调查对象外,如果还有 412 岁的儿童,则需要抽取 1 位进行儿童观众的调查。如果符合年龄的条件多于 1 位,则仍按二维随机表的方法确定。对于自我代表的 7 个城市中,为保证儿童的样本量,对每个样本户,调查所有满足年龄的儿童。五、自我代表层中的抽样方法五、自我代表层中的抽样方法5.15.1 自我代表城市的抽样方法自我代表城市的抽样方法每个需要进行推断的城市皆作为自我代表层,在层内也进行分层抽样,层的划分标准与其它子层中的区、县

26、标准基本相同。只不过不再对县分类,且将县级市(仅长沙市有一个)也作为一般县处理。这样每个城市皆分为一类区、二类区及县三层。考虑到上海市浦东新区的特殊性(既包括完全城市化的市区,也包含相当广泛的农村),将该区作为自我代表层处理。考虑到在一个城市范围内的调查,交通比较方便,故为提高效率,根据每个城市的实际情况,保证(或适当增加)样本区的数量,减少每个样本区、县内的的样本量。每统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设11个样本区县规定都抽 2 个街道(乡、镇),每个样本街道、乡、镇抽 2 个居(村)委会。样本区内每个居(村)委会样本量仍为本 15 户,样本县(县级市)

27、内每个村(居)委会样本量仍为 10 户。如果有可能,对一类区也可不对区进行抽样,直接对街道进行抽样。根据每个必调查城市所属的区县数,确定样本区、县数如下表(表中的数字为样本区、县数,括号中的数字为每个区、县的样本户数):表表 7 7 7 7自我代表城市的样本量自我代表城市的样本量城 市一类区二类区县总样本量总样本量北京市4(60)2(60)2(40)440440天津市3(60)2(60)2(40)380380上海市4(60)3(60)2(40)500500广州市3(60)2(60)2(40)380380成都市3(60)2(60)2(40)380380长沙市2(60)3(60)2(40)3803

28、80西安市4(45)2(60)2(40)380380总计总计总计总计1320132096096056056028402840其中浦东新区在商业区抽一个街道,在农业区抽一个镇。成都、西安两市由于一类区数量较少,故对一类区进行全数调查,其中西安市每个一类区中抽 1 个街道,每个街道抽 3 个居委会。若有条件在每个区中直接抽 3 个居委会最好。5.25.2 西藏自治区的抽样方法西藏自治区的抽样方法西藏自治区的抽样也采用分层抽样法,其中拉萨市城关区抽 4 个居委会,日喀则市除城关镇外,再抽两个乡镇,共 6 个居(村)委会。以上两市均作为自我代表层,每层各抽取60 户;其余 71 个县则采用按人口的 P

29、PS 抽样抽 2 个县,每个县调查 40 户。西藏自治区总样本量为 200 户。六、六、总样本量与总样本量与抽样误差的估计抽样误差的估计6 6.1.1 总样本量总样本量统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设12根据前述抽样设计,本方案 13 岁以上观众总的样本量为:1)自我代表层共 28402003040 户,其中区样本为 2400 户,县样本为 640 户。2)抽样总体分 11 个子层,55 个小层,样本区县共 121 个,其中样本区 45 个,样本县(县级市)76 个。每个样本区抽 90 户,故区样本为 4050 户;每个样本县抽 60 户,县样本共 45

30、60 户,共计 8610 户。3)全国总样本量为 11650 户,其中区样本为 6390 户,县样本为 5260 户。6 6.2.2 抽样误差的估计抽样误差的估计本方案的设计效应 deff 估计为 2.0,相当于简单随机抽样的样本量 n0=5825,在95%置信度下比例型目标量的绝对误差限 d,经计算约为 1.28%。七、七、七、七、目标量的估计及其方差估计目标量的估计及其方差估计根据方案设计,(小)层内样本是近似自加权的,因此层目标量的估计及其方差估计较为简单。而地区(大层)与全国目标量的估计则可用表 4 中的人口比例为权加权并汇总自我代表层得出,相应的方差估计也随之可得。具体公式另给。参考

31、文献参考文献1冯士雍,倪加勋,邹国华,抽样调查理论与方法,中国统计出版社,1998.2中华人民共和国民政部编,中华人民共和国行政区划简册,中国地图出版社,2001。3 联合国开发计划署,中国人类发展报告-1999,中国财政经济出版社,19994胡鞍钢,邹平等,中国发展报告 社会与发展中国社会发展地区差距研究,浙江人民出版社,2000。5L.基什(L.Kish)著,倪加勋等译,抽样调查,中国统计出版社,1997。统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设13附表:附表:19971997 年全国各省市人类发展指数年全国各省市人类发展指数(HDI)(HDI)省、市省、市

32、自治区自治区平均预期平均预期寿命指数寿命指数教育指数教育指数国内生产国内生产总值指数总值指数人类发展人类发展指数指数人类发展人类发展指数排位指数排位上海0.8320.8240.9750.8771北京0.7980.8400.9630.8672天津0.7890.8100.9570.8523广东0.7920.7890.9490.8434辽宁0.7540.8010.9390.8315浙江0.7800.7350.9490.8216江苏0.7730.7350.9450.8177福建0.7260.7370.9440.8028山东0.7600.7020.8490.7709黑龙江0.7000.7900.8090

33、.76610河北0.7560.7590.6760.73011吉林0.7160.8040.6100.71012海南0.7500.7450.6320.70913湖北0.7040.7610.6550.70714新疆0.6270.7730.6560.68515山西0.7330.7820.5220.67916湖南0.6990.7760.5110.66217河南0.7530.7450.4870.66118广西0.7290.7410.4780.64919安徽0.7410.7130.4820.64620内蒙古0.6780.7400.5170.64521重庆0.6890.7270.4890.63522江西0.6

34、850.7640.4550.63523四川0.6890.7230.4410.61724陕西0.7070.7410.4040.61725宁夏0.6990.6690.4400.60326云南0.6420.6650.4420.58327甘肃0.7040.6670.3390.57028青海0.5930.5450.4450.52829贵州0.6550.6590.2330.51630西藏0.5770.4350.3450.45231统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设14【案例二案例二】请对下面的请对下面的问卷客观地评价问卷客观地评价汽油的销售汽油的销售本次调查由国家汽油

35、代理商组织,希望更多地了解消费者购买汽油时的期望。所有信息都会被保密。表格填好后请返回给我们。1 姓名和地址2 年龄和性别3 婚姻状况4 年龄状况:21 岁以下2140 岁4060 岁60 岁以上5 大多数汽油是由您购买的还是您的妻子买的?6 去年您买了多少汽油?5000 升以上500010000 升100002000 升20000 升以上7 您的汽油油箱容积多大?8 在您选购汽油时,价格的重要程度如何?9 请您尽可能充分地陈述什么原因使得您购买一种品牌的汽油而不买另外一种?10.您喜欢那些免费提供礼物的加油站,是不是?11.当您用车执行公务时,您将获赠的礼物或赠券留给自己,还是上交给您的雇主

36、?12.您每年行驶的里程是长是短?谢谢您的合作。根据您对上述问题的回答,重新起草上面的调查问卷。统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设15【案例三案例三】某市造纸行业产品产量与结构分析某市造纸行业产品产量与结构分析某市造纸业在“十五”期间的产品产量、原材料消耗量、专用设备技术状况以及调查预测的 2006 年各类产品的需求量等资料如下:表 1“十五”期间各类产品产量单位:万吨产品名称产量预测的 1996 年需求量2001 年2005 年印刷用纸6.510.513.39书写用纸5.04.96.86技术配套用纸0.71.11.33包装用纸5.98.210.12其他用

37、纸1.12.03.33生活用纸7.51331.56纸板6.211.428.78其中:白纸板0.40.61.23箱纸板1.32.04.32挂面纸板0.050.51.20瓦楞纸板2.32.47.89合计26.739.766.59表 2“十五”期间主要原材料消耗量单位:万吨原 材 料原 材 料 消 耗量2001 年2005 年木浆5.56.7苇浆2.83.6蔗渣浆0.91.2竹浆0.40.5废纸浆4.18.6麻、布、棉浆1.83.2禾草浆9.915.6其他浆0.71.0合计26.140.4统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设16表 3专用设备技术状况单位:台专用设

38、备合计国际水平国内先进水平国内一般水平国内落后水平磨木机531蒸球19011674蒸锅5122造纸设备170343124要求:根据以上资料,对该市造纸行业的产品产量和结构进行分析。分析方法说明:分析方法说明:(1)对产品产量与结构进行分析,首先需要利用数字资料描述产品产量及其结构现状以及发展趋势,其次根据一定的研究目的分析产品结构的合理性。(2)分析研究可以采用静态分析与动态分析相结合的办法。静态分析主要是研究产品结构的现状,分析当前的产品结构是否满足社会需要,是否适应现有的生产力发展水平,从中确定哪些是合理的,哪些是不合理的;同时通过动态分析,反映产品结构演变的历史过程,预测产品结构将沿着什

39、么方向发展,这种发展是否适应经济发展的客观需要。在研究过程中,要结合本地区或本企业的实际情况,如原材料供应、设备状况、技术力量、企业管理水平等,进行多因素的对比分析,找出调整产品结构与提高产品产量的症结所在,并提出切实可行的措施。统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设17【案例四案例四】时间序列分析在经济预测中的应用时间序列分析在经济预测中的应用一、一、一、一、案例简介案例简介案例简介案例简介为了配合统计学课程时间序列分析部分的课堂教学,提高学生运用统计方法分析解决实际问题的能力,我们组织了一次案例教学,其内容是:对烟台市的未来经济发展状况作一预测分析,数据取

40、烟台市 19781998 年国内生产总值(GDP)的年度数据,并以此为依据建立预测模型,对 1999 年和 2000 年的国内生产总值作出预测并检验其预测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果,是反映国民经济活动最重要的经济指标之一,科学地预测该指标,对制定经济发展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时,我们首先将数据资料印发给学生,并讲清本案例的教学目的与要求,明确案例所涉及的教学内容;然后给学生一段时间,由学生根据资料,运用不同的方法进行预测分析,并确定具体的讨论日期;在课堂讨论时让学生自由发言,阐述自己的观点;最后,由主

41、持教师作点评发言,取得了良好的教学效果。经济预测是研究客观经济过程未来一定时期的发展变化趋势,其目的在于通过对客观经济现象历史规律的探讨和现状的研究,求得对未来经济活动的了解,以确定社会经济活动的发展水平,为决策提供依据。时间序列分析预测法,首先将预测目标的历史数据按照时间的先后顺序排列成时间序列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。本案例的最大特色在于:它汇集了统计学原理中的时间序列分析这一章节的所有知识点,通过本案例的教学,可以把不同的时间序列分

42、析方法进行综合的比较,便于学生更好地掌握本章的内容。二、二、二、二、案例的目的与要求案例的目的与要求案例的目的与要求案例的目的与要求(一)(一)教学目的教学目的1 通过本案例的教学,使学生认识到时间序列分析方法在实际工作中应用的必要统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设18性和可能性;2 本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机的结合在一起,以巩固学生所学的课本知识,深化学生对课本知识的理解;3 本案例是对烟台市的国内生产总值数据进行预测,通过对实证结果的比较和分析,使学生认识到对同一问题的解决,可以采取不同的方法,根据约束条件,从

43、中选择一种合适的预测方法;4 通过本案例的教学,让学生掌握 EXCEL 软件在时间序列分析中的应用,对统计、计量分析软件 SPSS 或 Eviews 等有一个初步的了解;5 通过本案例的教学,有助于提高学生运用所学知识和方法分析解决问题的能力、合作共事的能力和沟通交流的能力。(二)(二)教学要求教学要求1 学生必须具备相应的时间序列分析的基本理论知识;2 学生必须熟悉相应的预测方法和具备一定的数据处理能力;3 学生以主角身份积极地参与到案例分析中来,主动地分析和解决案例中的问题;4 在提出解决问题的方案之前,学生可以根据提供的样本数据,自己选择不同的统计分析方法,对这一案例进行预测,比较不同预

44、测方法的异同,提出若干可供选择的方案;5学生必须提交完整的分析报告。分析报告的内容应包括:选题的目的及意义、使用数据的特征及其说明、采用的预测方法及其优劣、预测结果及其评价、有待于进一步改进的思路或需要进一步研究的问题。三、三、三、三、数据搜集与处理数据搜集与处理数据搜集与处理数据搜集与处理时间序列数据按照不同的分类标准可以划分为不同的类型,最常见的有:年度数据、季度数据、月度数据。本案例主要讨论对年度数据如何进行预测分析。考虑到案例设计时的侧重点,本案例只是对烟台市国内生产总值进行预测,故数据的搜集与处理过程相对简单。我们通过查阅烟台统计年鉴、烟台五十年等有关的资料获得烟台市 1949200

45、0 年 23 年的国内生产总值资料数据(原始数据详见表 3)。该指标是反映国民经济发展情况最重要的指标之一,我们选择该指标进行预测具有较强的实用价值。此外,预测的方法具有普遍的适用性,使用者也可以将其应用于其它的研究领域。统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设19资料数据是预测的依据和基础,一般是根据确定的预测目标及影响因素搜集有关的资料和数据,并结合初步拟定的预测模型,对所搜集的数据进行分析和处理,然后再选取适当的预测模型。我们可以将整个数据处理过程概括如下,见图 1。四、四、建议使用的预测分析方法建议使用的预测分析方法(一)(一)确定性时间序列分析法确定性

46、时间序列分析法1指标法:平均增长量法、平均发展速度法;2趋势预测法:移动平均法、指数平滑法、曲线拟合法。(二)(二)随机性时间序列分析法随机性时间序列分析法1ARIMA 模型预测;2组合模型预测。明确预测目的确定预测内容收集和整理资料选择预测方法结果是否合理计算预测结果推荐预测结果进行综合评价精度的约束时间的约束资金的约束YN图 1经济预测流程图统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设20五、五、案例分析过程案例分析过程(一)(一)确定性时间序列分析法确定性时间序列分析法1 1 平均增长量法平均增长量法该方法是利用历史资料计算出它的平均增长量,然后再假定在以后各

47、期当中,它仍按这样一个平均增长量去增长,从而得出在未来一段时期内的预测值。根据烟台市的国内生产总值 1949 年1998 年的观察值,我们计算出 GDP 的平均增长量为 150647.69 万元(水平法)和 38437.81 万元(总和法),利用其对烟台市 1999 年和 2000 年的 GDP 值进行预测并与实际 GDP 值1比较,结果见表 1。表 1平均增长量法预测结果1999 年2000 年GDP 预测值(万元)预测相对误差(%)GDP 预测值(万元)预测相对误差(%)水平法7550647.75.697701295.412.44累计法7438437.87.107476875.615.00

48、教师点评:平均增长量法不仅得到了 GDP 数据未来取值的预测值,而且还让学生更加深刻地认识到平均增长量在计算时水平法与总和法的区别所在,图 1 较明显地反映出平均增长量计算水平法与累计的区别,即水平法仅考虑首尾年份的数值,而不考虑中间年份的数值变化,因而有nana=+)1(0;而总和法则考虑了整个样本区间上的总体变化情况,有=+niianaaa1000)()2()(,从而图 2 中 A 的面积和 B 的面积应该相等。11999 年为 8010000 万元,2000 年为 8700000 万元。010000002000000300000040000005000000600000070000008

49、00000019491952195519581961196419671970197319761979198219851988199119941997年 份万 元原 始GDP水 平 法GDP总 和 法GDPA图 2 由平均增长量推算出的时间序列变化图统计学精品课程建设统计学精品课程建设统计学精品课程建设统计学精品课程建设212 2 2 2 平均发展速度法平均发展速度法该方法就是利用时间序列资料计算出它的平均发展速度,然后再假定在以后各期当中,它仍按这样一个平均发展速度去变化,从而得出时间序列的预测值。我们计算出GDP 在 1978 年1998 年间的平均发展速度为 118.277%(几何法)和

50、118.170%(方程法)2,利用其对烟台市 1999 年和 2000 年的 GDP 进行预测得到结果见表 2。表 2平均发展速度法预测结果1999 年2000 年GDP 预测值(万元)预测相对误差(%)GDP 预测值(万元)预测相对误差(%)几何法8364664-4.479455081.6-7.49方程法8306352-3.749323713.9-6.00教师点评:同平均增长量的计算一样,平均发展速度的计算方法也有两种,其中几何法也只是考虑起始年份的取值,有nnXaa0=,而方程法则要考虑到整个年份取值的变化,有=+niinaXaXaXa10200,方程法的内插预测曲线与原始曲线所夹的面积

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁