《统计学原理统计描述案例.pptx》由会员分享,可在线阅读,更多相关《统计学原理统计描述案例.pptx(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/3/201 本案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总体的统计处理过程,包括分布描述、分类研究和相关因素分析。数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。第1页/共24页2023/3/202 案例的背景分析与数据资料 一、案例的现实意义 上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。对所有上市公司的财务报告进行统计整理和分析,把握上市
2、公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。第2页/共24页2023/3/203二、案例所依托的总体及其现状与研究目的(一)案例所依托的客体 本案例所依托的客体是1999年上市公司年报中的有关财务指标。1999年末,沪、深两市共有上市公司949家。这些上市公司分布在13个行业部门。根据中国证监会的上市公司
3、分类指引中规定的分类方法,其中制造业共有578家,占60.91%。总股本1938亿元,占62.73%,制造业是上市公司最集中的行业。截止2000年4月30日,已公布年报的有560家。所以本案例研究的总体范围确定为如期公布年报的制造业560家上市公司。第3页/共24页2023/3/204(二)案例研究的目的与任务1.上市公司年报财务数据统计分析的目的 通过对制造业1999年报有关数据进行系统的统计整理、描述和回归分析,揭示1999年制造业上市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。2.上市
4、公司年报财务数据统计分析的任务 对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。第4页/共24页2023/3/2053.上市公司年报财务数据统计分析的对象 本案例所引用资料取自上海证券报,包括了制造业560家上市公司。共选有8个财务指标:总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。其中,前4个为反映资产、收益方面的总量指标,后4个为反映盈利能力、业绩水平的相对指标。第5页/共24页2023/3/2064 4数据的初步分析数据的初步分析制造业上市公司行业
5、制造业上市公司行业结构结构 在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。根据上市公司分类指引,制造业进一步分为10个行业种类,编码为C0、C1、C2、C9。分类统计属于定名测定。从上述资料经计数整理后即可得到如表一的分布数列。第6页/共24页2023/3/207 这是一个品质标志分组的分布数列。从该数列中可以知道上市公司的行业结构。1999年560个制造业上市公司中,制造业上市公司中传统产业占了较大比重。代码代码行业分类行业分类上市公上市公司数司数
6、比重(比重(%)C0C0食品、饮料食品、饮料48488.578.57C1C1纺织、服装、皮毛纺织、服装、皮毛45458.048.04C2C2木材、家具木材、家具2 20.360.36C3C3造纸、印刷造纸、印刷16162.862.86C4C4石油、化学石油、化学13013023.2123.21C5C5橡胶、塑料橡胶、塑料10101.791.79C6C6金属、非金属金属、非金属969617.1417.14C7C7机械、仪表、设备机械、仪表、设备15115126.9626.96C8C8通讯、电子通讯、电子51519.119.11C9C9其他其他11111.961.96合合 计计560560100.
7、00100.00表21 制造业上市公司行业分布第7页/共24页2023/3/208方 案 设 计一、案例设计的思路 为了对总体对象有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。根据这一目的,本案例按照如下顺序对数据进行处理:1分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其一般水平。2分别计算总体各变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差、峰度度、偏度等。3分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。第8页/共24页2023/3/2094分别按品质标志和数量标志对总体进行分类
8、,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。5分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。6在上述研究分析的基础上给出关于对对象的定性认识结论。第9页/共24页2023/3/2010二、案例设计的工作过程二、案例设计的工作过程(一)数据整理与描述1编制按各财务指标的变量数列(1)将数据顺序排列。(2)计算描述统计指标。(3)分析描述统计指标比较平均数、众数、中位数的大小;偏度系数的大小、方向等。(4)确定组数和组距当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系
9、数较大、分布明显偏态时,以平均数为中心,以K倍标准差为组距。(5)整理成频数分布和直方图(或其他图形),显示总体分布特征。第10页/共24页2023/3/20112 2制造业公司主要财务指标的分布制造业公司主要财务指标的分布(1)总资产分布数列和直方图平均平均平均平均标准误差标准误差标准误差标准误差中位数中位数中位数中位数众数众数众数众数标准差标准差标准差标准差 样本方差样本方差样本方差样本方差峰值峰值峰值峰值偏斜度偏斜度偏斜度偏斜度全距全距全距全距最小值最小值最小值最小值最大值最大值最大值最大值求和求和求和求和计数计数计数计数置信度置信度置信度置信度 (95%95%95%95%)158315
10、.1158315.1158315.1158315.18970.9468970.9468970.9468970.94695296.995296.995296.995296.9212291.3212291.3212291.3212291.34.51E+104.51E+104.51E+104.51E+1030.1907730.1907730.1907730.190774.7051284.7051284.7051284.705128217859821785982178598217859812256.6912256.6912256.6912256.6921908462190846219084621908
11、468865645288656452886564528865645256056056056017620.8917620.8917620.8917620.89平均平均平均平均标准误差标准误差标准误差标准误差中位数中位数中位数中位数众数众数众数众数标准差;标准差;标准差;标准差;样本方差样本方差样本方差样本方差峰值峰值峰值峰值偏斜度偏斜度偏斜度偏斜度全距全距全距全距最小值最小值最小值最小值最大值最大值最大值最大值求和求和求和求和计数计数计数计数置信度置信度置信度置信度(95%95%95%95%)144640.7144640.7144640.7144640.76388.9486388.9486388
12、.9486388.94895410.4895410.4895410.4895410.48149424.9149424.9149424.9149424.92.23E2.23E2.23E2.23E101010109.9163759.9163759.9163759.9163752.8852382.8852382.8852382.885238955269.6955269.6955269.6955269.621671.4921671.4921671.4921671.49976941.1976941.1976941.1976941.1791184787911847879118478791184785475
13、4754754712549.9212549.9212549.9212549.92总资产描述统计总资产描述统计1 1总资产描述统计总资产描述统计2 2第11页/共24页2023/3/2012 从描述统计1看,560家公司的总资产呈高度偏态。总资产最大值和最小值相差近200倍。将6个总资产100亿和7个2亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。但仍呈偏态,不能用斯特吉斯经验确定组数。不论何种分布,均值和方差是其分布的两个主要特征值。第12页/共24页2023/3/2013 由总资产描述统计2表看出,均值14.5亿元,中位数9.5亿元,标
14、准差15亿元,说明560家公司的总资产分布为右偏态。若以1个标准差为组距,则中位数以下部分的描述势必过于概括。所以考虑用1/2标准差,即7.5亿元为组距,由于100亿元以上只有6家,将105亿元以上并为一组,组数=15。分组后变量数列及直方图如表二和图一所示。分组(亿元)分组(亿元)频数频数频率频率(%)7.5 以下以下7.51515.22.522.5303037.537.5454552.552.5606067.567.5757582.582.5909097.597.5105105以上以上20920919219264643333181815154 42 24 46 62 21 13 31637
15、.3237.3234.2934.2911.4311.435.895.893.213.212.682.680.710.710.360.360.710.711.071.070.360.360.180.180.540.540.180.181.071.07合计合计560560100.00100.00 表22 560家上市公司总资产分组统计第13页/共24页2023/3/2014 从图表中可以知道,制造业中,总资产8866亿元,平均规模在15亿元左右。82%的上市公司总姿产在22.5亿元以下,100亿元以上的只有1%。在各行业中,总资产规模最大的是C8通信电子行业20.3亿元,最低的是C2木材家具业6.
16、38亿元,另外,C4石油化工、C5橡胶塑料、C6金属非金属的总资产规模在平均之上。第14页/共24页2023/3/2015(2)净利润分布数列和直方图 净利润分布呈右偏态。以1/2标准差6500万元为组距,可分17组。分组后3.25亿元以上各组不仅频数少,而且有两组频数为0。这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。将亏损1.3亿元以下的公司合并为一组,3.25亿元以上的公司合并为一组,组数减少到9组,总体仍为右偏态.见表23和图22。平均平均标准误差标准误差中位数中位数众数众数标准差标准差样本方差样本方差峰值峰值偏斜度偏斜度全距全距全距全距最小值最小值最大值最大值求
17、和求和计数计数置信度置信度(95%95%)6669.486669.48516.2828516.28284120.1644120.164#N/A#N/A12217.4812217.481.49E+081.49E+0811.3334411.333442.4855722.485572112886.5112886.537417.937417.975468.675468.6373491337349135605601014.0921014.092 净利润描述统计 第15页/共24页2023/3/2016净利润分组(万元)净利润分组(万元)频频 数数 (个)(个)频频 率率 (%)1300013000以下以
18、下130001300065006500650006500006500065006500130006500130001300019500130001950019500260001950026000260003250026000325003250032500以上以上14141010222233233211211224241313161617172.502.5079793.933.9359.2959.2920.0020.004.294.292.322.322.862.863.043.04合合 计计560560100.00100.00 图22 560家上市公司净利润分布 表23 560家上市公司净利润
19、分布第16页/共24页2023/3/2017 从整理后的净利润的资料我们注意到:第一,制造业中,1999年度46家公司亏损,亏损面8.2%,最多的亏损3.7亿元。第二,制造业1999年度净利润总额373.9亿元,受亏损公司的影响,560家公司总体平均利润只有6500万元。79%的上市公司净利润在70万1.3亿元之间。第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在7亿元以上;年净利润在4.5亿元以上的公司有16个,不足总数的3%,但它们的净利润占到制造业全行业的25.5%,充分体现了大型国企确实是国民经济的脊梁。第17页/共24页2023/3/2018(3 3)每股
20、收益分布数列和直方图)每股收益分布数列和直方图平均平均标准误差标准误差中位数中位数众数众数标准差;标准差;样本方差样本方差峰值峰值偏斜度偏斜度区域区域最小值最小值最大值最大值求和求和计数计数置信度置信度(95%95%)0.1994270.1994270.0115510.0115510.22250.22250.210.210.2733520.2733520.0747210.0747216.756416.756411.511821.511822.6322.6321.281.281.3521.352111.6792111.67925605600.0226890.022689平均平均标准误差标准误差中
21、位数中位数众数众数标准差;标准差;样本方差样本方差峰值峰值偏斜度偏斜度区域区域最小值最小值最大值最大值求和求和计数计数置信度置信度(95%95%)0.2049430.2049430.0105710.0105710.2230.2230.210.210.2492550.2492550.0621280.0621284.9121744.9121741.274991.274991.88911.88910.980.980.90910.9091113.9482113.94825565560.0207640.020764每股收益描述统计 2每股收益描述统计 1第18页/共24页2023/3/2019 从描述统
22、计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。尝试按经验公式确定组数:组数=1+3.322560=10;组距=2/10=0.2,极值用开口组处理。见表24 和图23。图23 560家上市公司每股收益分布 分分 组组频数(个)频数(个)频率频率(%)0.60.6以下以下0.60.60.40.40.40.40.20.20.200.2000.200.20.20.40.20.40.40.60.40.60.60.80.60.80.81.00.81.01.01.0以上以上14146 613131313197197231231606019196 61 12.502.501.071
23、.072.322.322.322.3235.1835.1841.2541.2510.7110.713.393.391.071.070.180.18合合 计计560560100.00100.00表24 560家上市公司每股收益分组统计第19页/共24页2023/3/2020 净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。从统计资料看到:第一,1999年度,制造业的总体净资产收益率9%(这里采用了中位数,因为忽略极值厚中位数没有变化,但平均数却差了几倍,而净资产收益率极端值时有个别特殊原因所致)。第二,8%的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负
24、数,以资不抵债。第三,34%的公司净资产收益率在0.1%8%之间;48%的公司在0.8%16%之间。第四,8%的公司净资产在16%32%的高水平上,从行业看,这些公司集中在生物制药、通信电子、汽车等高新技术产业,显示出发展最快、盈利水平最强的势头。第20页/共24页2023/3/20213 3制造业各行业主要财务指标的分制造业各行业主要财务指标的分布布 接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。(1)制造业各行业净利润分布频数统计表和频率统计表(2)制造业各行业每股净收益分布频数统计和频率统计第21页/共24页2023/3
25、/2022三、数据整理和分析的客观评价 (一)案例对560家上市公司1999年报8个财务指标数据整理分析过程的优点。整理频数分布的时候借助于描述指标的判断,使统计整理工作有了着眼点当面对纷繁的、大量的原始数据,总体的分布及数据的分布特征根本无从得知.因此编制数据的频数分布从那里着手呢?根据的是什么呢?当然是数据总体的几个主要特征值:平均数(众数、中位数)、全距、方差、偏度等.而应用统计软件,这些特征值很容易得到.掌握了这些特征值,对分组的组数、组距的确定才有了依据.所以案例提出的方法,解决了整理频数分布的可操作性问题。第22页/共24页2023/3/2023(二)几个有待进一步研究的问题1频数分布的编制没有固定的模式,因此不是唯一的,采用不同的组距、组限,就有不同的分布数列.如何评价哪一个数列最恰当或者最确切反映总体分布特征是一个值得研究的问题。2统计整理中的制造业行业分组所汇总的统计表,是按照全行业整理时的组距分组的.对不同行业来说,这种组距、组数的划分不一定是最恰当的.若要研究某一行业情况,可根据其指标(变量)差异情况另行分组。第23页/共24页2023/3/2024感谢您的观看!第24页/共24页