《统计学依据数据的计量尺度_高等教育-统计学.pdf》由会员分享,可在线阅读,更多相关《统计学依据数据的计量尺度_高等教育-统计学.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 统计学依据数据的计量尺度将数据划分为三类:定距型数据(Scale)、定序型数据(Ordinal)、定类型数据(Nominal)。定距型数据通常是指诸如身高、体重、血压等的连续型数据,也包括诸如人数、商品件数等离散型数据;定序型数据具有内在固有大小或高低顺序,但它又不同于定距型数据,一般可以数值或字符表示。如职称变量可以有低级、中级、高级三个取值,可以分别用 1、2、3 等表示,年龄段变量可以有老、中、青三个取值,分别用 A B C 表示等。这里,无论是数值型的 1、2、3 还是字符型的 A B C,都是有大小或高低顺序的,但数据之间却是不等距的。因为,低级和中级职称之间的差距与中级和高级职称
2、之间的差距是不相等的;定类型数据是指没有内在固有大小或高低顺序,一般以数值或字符表示的分类数据。如性别变量中的男、女取值,可以分别用 1、2 表示,民族变量中的各个民族,可以用 汉回满等字符表示等。这里,无论是数值型的 1、2 还是字符型的 汉回满,都不存在内部固有的大小或高低顺序,而只是一种名义上的指代。我觉得教育年限应该设置成定距型数据(Scale)吧。因为,教育年限应该是一个连续的变量,它不存在内在的大小或高低顺序问题。将可变的数量标志抽象化就称其为变量,其取值称为变量值或标志值。变量分为确定性变量和随机变量。确定性变量是指受必然性因素的作用,各变量值呈现出上升或下降惟一方向性变动的变量
3、;随机变量是指受偶然性因素的作用,变量值呈现出随机的混沌状态变动的变量。根据变量的取值是否连续划分,有连续型变量和离散型变量。连续型变量是指在一个取值区间内可取无穷多个值。连续型变量值要用测量或计算的方法取得;离散型变量是指在一个取值区间内变量仅可取有限个可列值。离散型变量值只能用计数的方法取得。离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得.反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的
4、身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.如果变量可以在某个区间内取任一实数,即变量的取值可以是连续的,这随机变量就称为连续型随机变量,1)无偏性。无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为 ,所选择的估计量为,如果 E()=,称 为 的无偏估计量。(2)有效性。一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。假定有两个用于估计总体参数的无偏估计量,分别用 m1 和m2 表示,它们的抽样分布的方差分别用 D(m1)和 D(m2)表示,如果 m1 的方差小于 m2 的方差,即 D(m1)30 时接近正态曲线,
5、当 v=时和正态曲线合一,由于分布受自由度制约,所以 t 值与其相应的概率也随自由度而不同。二、评价估计量的标准 1无偏性(unbiased)由于估计量是样本的函数,是随机变量,它对于不同样本观测值会得到不同的估计值。我们自然希望这些估计值的平均值与参数的真值相等,也就是一个好的估计量的期望等于未知参数的真实值,具有这种性质的估计量,称为无偏估计量(unbiased estimate).即当估计值的期望()E时,称为的无偏估计量。2有效性(effectiveness)有时未知参数的无偏估计量不是唯一的,那么如何比较其好坏呢?自然是估计量与参数的偏差越小越好,因为()E,也就是的方差越小越好。我
6、们把方差最小的那个估计量称为有效估计量(efficient estimator)。3一致性(consistency)如果随着容量增加,统计量的值越来越接近总体参数值,那么这样的统计量就是与总体参数一致的估计量。样本容量越大,估计量的一致性越可靠。重血压等的连续型数据也包括诸如人数商品件数等离散型数据定序型数据具有内在固有大小或高低顺序但它又不同于定距型数据一般可以数值或字符表示如职称变量可以有低级中级高级三个取值可以分别用等表示年龄段变量可以有的因为低级和中级职称之间的差距与中级和高级职称之间的差距是不相等的定类型数据是指没有内在固有大小或高低顺序一般以数值或字符表示的分类数据如性别变量中的男女取值可以分别用表示民族变量中的各个民族可以用汉回的指代我觉教育年限应该设置成定距型数据吧因为教育年限应该是一个连续的变量它不存在内在的大小或高低顺序问题将可变的数量标志抽象化就称其为变量其取值称为变量值或标志值变量分为确定性变量和随机变量确定性变量是