贾俊平第六版统计学课后思考题答案张云飞实用.pdf

上传人:蓝**** 文档编号:94787802 上传时间:2023-08-07 格式:PDF 页数:15 大小:1.70MB
返回 下载 相关 举报
贾俊平第六版统计学课后思考题答案张云飞实用.pdf_第1页
第1页 / 共15页
贾俊平第六版统计学课后思考题答案张云飞实用.pdf_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《贾俊平第六版统计学课后思考题答案张云飞实用.pdf》由会员分享,可在线阅读,更多相关《贾俊平第六版统计学课后思考题答案张云飞实用.pdf(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第一章 导论 1.什么是统计学统计学是 收集、处理、分析、解释 数据并从数据中 得出结论 的科学。2.解释描述统计和推断统计描述统计 研究的是数据 收集、处理、汇总、图表描述、概括与分析 等统计方法。推断统计 是研究如何利用 样本数据 来 推断总体特征 的统计方法。3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能 归于某一类别 的 非 数字型数据,它是对事物进行分类的结果,数据表现为类别,是用 文字 来表述的。顺序数据:是只能 归于某一有序类别 的 非 数字型数据。虽然也有列别,但这些类别是 有序 的。数值型数据:是按 数字尺度 测量的观察值,其结果表现为具体的 数

2、值。4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的 品质特征,通常是用文字来表述的,其结果均表现为 类别,因此也可统称为 定性数据 或 品质数据;数值型数据说明的是现象的 数量特征,通常是用 数值 来表现的,因此也可称为 定量数据 或 数量数据。5.举例说明总体、样本、参数、统计量、变量这几个概念总体 是包含所研究的 全部个体(数据)的 集合;样本 是从总体中抽取的 一部分元素 的 集合;参数 是用来描述 总体特征 的 概括性数字度量;统计量 是用来描述 样本特征 的 概括性数字度量;变量 是说明现象某种 特征的概念。比如我们欲了解某市的 中学教育情况,那么该市的

3、所有中学 则构成一个 总体,其中的 每一所中学 都是一个 个体,我们若从全市中学中按某种抽样规则 抽出 了 10 所中学,则这 10 所中学 就构成了一个 样本。在这项调查中我们可能会对升学率 感兴趣,那么升学率就是一个 变量。我们通常关心的是全市的 平均升学率,这里这个平均值就是一个 参数,而此时我们只有 样本 的有关升学率的数据,用此样本计算的平均值就是 统计量。6.变量可以分为哪几类分类变量:一个变量由 分类数据 来记录就称为分类变量。顺序变量:一个变量由 顺序数据 来记录就称为顺序变量。数值型变量:一个变量由 数值型数据 来记录就称为数值型变量。离散变量:可以取有限个值,而且其取值都以

4、 整位数 断开,可以 一一例举。连续变量:可以取无穷多个值,其取值是 连续不断 的,不能 一一例举。(当离散变量的取值 很多 时,也可以将离散变量当作连续变量来处理)7.举例说明离散型变量和连续性变量离散型变量,只能取 有限个值,取值以整数位断开,比如“企业数”。连续型变量,取之 连续不断,不能一一列举,比如“温度”。8.请列举出统计应用的几个例子人口普查,商场民意调查等。9.请列举出应用统计的几个领域国民经济核算与研究;市场调查分析;社会公共事业统计领域;金融市场领域等 贾俊平第六版统计学课后思考题答案第二章 数据的收集 1.什么是二手资料?使用二手资料应注意什么问题 二手资料:与研究内容

5、有关、由 别人 调查和试验而来、已经存在 并会被我们 利用 的资料。问题:使用时要进行 评估,要考虑到资料的 原始收集人、收集 目的、收集 途径、收集 时间 且使用时要 注明 数据来源。2.比较概率抽样和非概率抽样的特点,指出各自适用情况 概率抽样:也称为 随机抽样,是指遵循 随机原则 进行的抽样,总体中每个单位都有 一定的机会 被选入样本。当用样本对总体目标量进行估计时,要考虑到 每个单位样本 被 抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的 数量特征,得到总体参数的 置信区间,就使用概率抽样。非概率抽样:指抽取样本时 不是 依据随机原则,而是 根据 研究目的对数

6、据的 要求,采用某种方式从总体中抽出部分单位对其实施调查。操作简单,时效快,成本低,而且对于抽样中的统计学专业 技术要求不 是很 高。它适合 探索性 的研究,调查结果用于 发现问题,为更深入的数量分析 提供准备。它同样使用市场调查中的 概念测试(不需要调查结果投影到总体的情况)。3.除了自填式,面访式和电话式还有什么搜集数据的办法 试验式 和 观察式 等 4.自填式、面访式、电话式调查各有什么利弊 自填式优点:调查组织者 管理容易;成本低,可进行 大规模调查;减少 被调查者回答敏感问题 压力。缺点:返回率低;不适合 结构复杂 的问卷,调查内容有限;调查 周期长;在数据搜集过程中遇见问题 不能及

7、时调整。面访式优点:回答率高;数据质量高;在调查过程中遇见问题 可以及时调整。缺点:成本 比较 高;搜集数据的方式对调查过程的 质量控制有 一定 难度;对于敏感问题,被访者会 有压力。电话式优点:速度快;对调查员比较 安全;对访问过程的 控制 比较 容易。缺点:实施 地区有限;调查 时间不能过长;使用的问卷要 简单;被访者不愿回答时,不易劝服。6.如何控制调查中的回答误差 对于 理解误差,我会去学习一定的 心理学 知识;对于 记忆误差,我会尽量去 缩短 所涉及的 时间范围;对于 有意识误差,我要做好被调查者的心理工作,要 遵守职业道德,为被调查者 保密,尽量在问卷中 不涉及敏感问题。7.怎样减

8、少无回答 对于 随机误差,要 提高样本容量;对于 系统误差,只有做好 准备工作 并做好 补救措施。比如说要一百份的问卷回复,就要做好一百二十到一百三十的问卷准备,进行面访式的时候要尽量的 劝服 不愿意回答的被访者,以 小物品的馈赠 提高回复率。第三章 数据的图表展示 1.数据预处理包含哪些内容 数据审核(对于 原始数据:完整性 和 准确性;对于 二手数据:适用性 和 时效性),数据筛选 和 数据排序。2.分类数据和顺序数据的整理和图示方法各有哪些 分类数据:制作 频数分布表,用 比例(部分与整体比值)、百分比(比例乘 100%)、比率(不同类别之间比值)等进行 描述性分析。可用 条形图、帕累托

9、图、饼图 和 环形图 进行图示分析。顺序数据:制作频数分布表,用比例,百分比,比率。累计频数 和 累计频率 等进行描述性分析。可用 条形图,帕累托图 和 饼图,累计频数分布图 和 环形图 进行图示分析。3.数值型数据的分组方法和组距分组的步骤 分组方法:单变量值 分组和 组距 分组,组距分组又分为 等距分组 和 异距分组。分组步骤:1 确定组数(5-15);2 确定各组组距;3 根据分组整理成频数分布表。4.直方图和条形图的区别 条形图使用图形的 长度表示 各类别频数的 多少,其 宽度固定;直方图用 面积 表示各组频数,矩形的 高度 表示每一组的 频数或频率,宽度 表示 组距。直方图各矩形 连

10、续排列,条形图分开排列。条形图主要展示 分类数据;直方图主要展示 数值型数据。5.绘制线图应注意哪些问题 时间 在 横轴,观测值 绘在 纵轴。一般是长宽比例 10:7 的长方形,纵轴下端一般从 0 开始,数据与 0 距离过大的话用折断符号 折断。6.饼图和环形图有什么不同 饼图只能显示 一个样本或总体 各部分所占比例,环形图可以同时绘制 多个样本或总体 的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。7.茎叶图比直方图的优势,他们各自的应用场合 茎叶图既能给出数据的 分布情况,又能给出每一个 原始数据,即保留了原始数据的信息。在应用方面,直方图 通常适用于 大批量数据,茎

11、叶图 适用于 小批量数据。8.鉴别图标优劣的准则 显示数据;精心设计,有助于洞察问题的本质;使复杂的观点得到简明、确切、高效的阐述;能在最短的时间内以最少的笔墨给读者提供大量的信息;多维的;表述数据的真实情况。9.制作统计表应该注意哪几个问题 合理安排统计表 结构;表头一般包括 表号,总标题 和表中数据的 单位 等内容;表中的 上下 两条 横线 一般用 粗线,中间 的其他用 细线;在使用统计表时,必要时可在下方加 注释,注明数据来源。第四章 数据的概括性度量 1.一组数据的分布特征可以从哪几个方面进行测度 分布的 集中趋势:反映各数据向其中心值靠拢或集中的程度;分布的 离散程度,反映各数据远离

12、其中心值的趋势;分布的 形状,反映数据分布的偏态和峰态。2.怎样理解平均数在统计学中的地位 平均数在统计学中具有重要的地位,是集中趋势的 最主要 的测度,主要适用于 数值型数据,而不适用于分类数据和顺序数据。3.简述四分位数的计算方法 四分位数是一组数据 排序后 处于 25%和 75%位置上的值。根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。4.对于比率数据的平均为什么采用几何平均 在实际应用中,对于 比率数据 的平均采用 几何平均 要比算数平均更合理。从公式(+)=+=中也可看出,G 就是 平均增长率。5.简述众数、中位数和平均数的

13、特点和应用场合 众数 是一组数据分布的 峰值,不受极端值的影响,缺点是具有 不唯一性。众数只有在数据量 较多 时才 有意义,数据量较少时不宜使用。主要适合作为 分类数据 的集中趋势测度值。中位数 是一组数据 中间位置 上的 代表值,不受 极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为 顺序数据 的集中趋势测度值。平均数 对 数值型 数据计算的,而且利用了 全部 数据信息,在实际应用中 最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数 易受极端值 的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。6.简述异众

14、比率、四分位差、方差或标准差的适用场合 对于 分类数据,主要用 异众比率 来测量其离散程度;对于 顺序数据,虽然也可以计算异众比率,但主要使用 四分位差 来测量其离散程度;对于 数值型数据,虽然可以计算异众比率和四分位差,但主要使用 方差或标准差 来测量其离散程度。7.标准分数有哪些用途 标准分数给出了一组数据中各数值的 相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行 标准化处理。它还可以用来判断一组数据是否有 离群数据。8.为什么要计算离散系数 方差和标准差 是反映数据分散程度的 绝对值,一方面其数值大小 受 原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一

15、方面,它们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。因此,为 消除变量值水平高低 和计量单位不同 对离散程度测度值的影响,需要计算离散系数。9.测度数据分布形状的统计量有哪些 对分布形状的测度有 偏态 和 峰态。测度偏态的统计量是 偏态系数,测度峰态的统计量是 峰态系数。第五章 概率与概率分布 1.频率与概率有什么关系 在 相同条件下 随机试验 n 次,某事件 A 出现 m 次,则比值 m/n 称为事件 A 发生的频率。随着 n 的增大,该频率 围绕 某一常数 p 波动,且 波动幅度 逐渐减小,趋于 稳定,这个频率的 稳定值 即为该事件的 概率。2.独立性与

16、互斥性有什么关系 互斥事件 一定 是相互依赖(不独立)的,但相互依赖的事件 不一定 是互斥的。不互斥事件 可能 是独立的,也可能是不独立的,但独立事件 不可能 是互斥的。3.根据自己的经验体会举几个服从泊松分布的随机变量的实例 如某种仪器每月出现故障的次数、一本书一页中的印刷错误、某一医院在某一天内的急诊病人数等 4.根据自己的经验体会举几个服从正态分布的随机变量的实例 如某班某次的考试成绩、某地区成年男性的身高、某公司年销售量、同一车间产品的质量等 第六章 统计量及其抽样分布 1.什么是统计量?为什么要引进统计量?统计量为什么不含任何未知参数 统计量:设 1,2,是从总体 X中抽取的容量为

17、n 的一个样本,如果由此样本构造一个函数 T(1,2,),不依赖于任何未知参数,则称函数 T(1,2,)是一个统计量。原因:由样本构造具体的统计量,实际上是对样本所有的总体信息按某种要求进行加工处理,把分撒在样本信息 集中 到统计量的 取值 上,因此统计推断问题就由样本信息推断总体特征转变为由样本构成的 统计量推断总体参数,而且对于 不同 的统计推断问题可以根据同一样本构造 不同 的统计量进行研究。由于样本 已经抽出,所以统计量总是知道的,故统计量不含任何未知参数。3.什么是次序统计量 设 1,2,是从总体 X中抽取的一个样本,()称为第 个 次序统计量,它是样本(1,2,)满足如下条件的函数

18、:每当样本得到一组观察值 1,2,时,其由小到大的排序(1)(2)()()中,第 个值()就作为次序统计量()的 观测值,而(1),(2),()称为次序统计量。其中,()和()分别为 最小 和 最大 次序统计量。4.什么是充分统计量 统计量加工过程中 一点信息都不损失 的统计量为充分统计量 5.什么是自由度 自由度指的是计算某一统计量时,取值不受限制的变量个数。通常=。其中 为 样本数量,为被限制的 条件数 或 变量个数,或计算某一统计量时用到其它 独立 统计量的个数。自由度通常用于 抽样分布 中。6.简述 分布、分布、分布及正态分布之间的关系 正态 分 布:Z=N(0,1),则 XN(,)2

19、分 布:设 随机 变量 1,2,相互独立,且(i=1,2,n)服 从 标准正态 分 布 N(0,1),则它 们 的 平方 和 2=1服 从自由度为 n 的 2分 布。分 布:设 随机 变量 XN(0,1),Y2(),且 X与 Y独立,则 t=。其分 布 称为 分 布,记 为()。分 布:设 随机 变量 X与 Z相互独立,且 Y和 Z分别 服 从自由度为 m和 n的 2分 布,随机 变量X有 表达式:X=,则称 X服 从第一自由度为 m第 二 自由度为 n的 分 布。记 为(,)。7.什么是抽样分布 在总体 X的分 布类型已 知时,若 对任一自 然 数,都能导出 统计量 T=T(1,2,)的分

20、布 的数 学表达式,这 种分 布 成为 精确 的抽样分 布。8.简述中心极限定理及其意义 中 心极 限 定 理:设从 均 值为,方差 为 2的一个任 意 总体中抽取容量为 n的样本,当 n充分大时,本 均 值的抽样分 布近似服 从 均 值为、方差 为2的 正态 分 布。意义:是 数理统计学 和 误差分析 的理 论基础,指 出了 大量 随机 变量 之 和 近似服 从 正态分布 的 条件。第七章 参数估计 1.解释估计量和估计值 估计量:用于估计总体参数的 随机变量。估计值:估计参数时计算出来的统计量的 具体值。2.评价估计量好坏的标准 无偏性:估计量抽样分布的 数学期望等于 被估计的 总体参数。

21、有效性:对同一总体参数的两个无偏点估计量,有 更小标准差 的估计量更有效。一致性:随着样本容量的增大,估计量的值越来越 接近 被估计的总体参数。3.怎样理解置信区间 由样本统计量所构造的总体参数的 估计区间。4.解释 95%的置信区间 用某种方法构造的 所有区间中 有 95%的区间 包含 总体参数的真值。5.的含义是什么 2是标准正态分布 上侧面积 为2的 值,公式是统计总体均值时的 边际误差(估计误差)。6.解释独立样本和匹配样本的含义 独立样本:如果两个样本是从两个总体中 独立抽取 的,即一个样本中的元素与另一个样本中的元素相互独立。匹配样本:一个样本中的数据与另一个样本中的数据 相对应。

22、7.在对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定 两个总体都服从 正态分布;两个随即样本 独立 地分别抽自两个总体 8.简述样本量与置信水平、总体方差、估计误差的关系=(2)222 样本量与 置信水平 成 正比;与 总体方差 成 正比;与 估计误差的平方 成 反比。第八章 假设检验 1.假设检验和参数估计有什么相同点和不同点 参数估计和假设检验是 统计推断 的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的 角度不同。参数估计 讨论的是用 样本统计量 估计 总体参数 的方法,总体参数 在估计前是 未知 的。而在 假设检验 中,则是先对 的值提出一个 假设,然后利

23、用样本信息去检验 这个假设是否成立。2.什么是假设检验中的显著性水平?统计显著是什么意思 显著性水平是指当原假设 正确 时 却被拒绝 的 概率和风险。统计显著 等价拒绝,指求出的值落在小概率的区间上,一般是落在 0.05 或比 0.05 更小的显著水平上。3.什么是假设检验中的两类错误 假设检验的结果可能是错误的,所犯的错误有两种类型:一类错误是原假设 为真 却被我们 拒绝 了,犯这种错误的概率用 表示,所以也称 错误或 弃真 错误;另一类错误是原假设 为伪 我们却 没有拒绝,犯这种错误的概论用 表示,所以也称 错误或 取伪 错误。4.两类错误之间存在什么样的数量关系 在假设检验中,与 是此消

24、彼长的关系。如果减小 错误,就会增大犯 错误的机会;若减小 错误,也会增大犯 错误的机会。5.解释假设检验中的 值 值就是当 原假设为真 时所得到的样本观察结果或 更极端结果 出现的概率。(它的大小取决于 三 个因素:一个是样本数据与原假设之间的差异;一个是样本量;再一个是被假设参数的总体分布。)6.显著性水平与 值有何区别 显著性水平 是原假设为真时,拒绝原假设的概率,是一个 概率值,被称为抽样分布的拒绝域,大小由研究者 事先确定,一般为 0.05。而 值只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为 观察到 的(或实测的)显著性水平 7.假设检验依据的基本原理是什么 假

25、设检验依据的基本原理是“小概率原理”,即发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以作出是否拒绝原假设的决定。8.在单侧检验中原假设与备择假设的方向应该如何确定 将研究者想收集证据予以支持的假设作为备择假设,将研究者想收集证据证明其不正确的假设作为原假设,先确立备择假设,备择假设的方向与想要证明其正确性的方向一致,原假设与备择假设是 互斥 的,等号总在原假设上。第九章 分类数据分析 1.简述列联表的构造与列联表的分布 构造:列联表是由 两个以上 的变量进行交叉分类的 频数分布 表。分布:列联表的分布可以从两个方面来看:一个是观察值的分布;一个是期望值的分布。(1)观

26、察值:条件 频数、行边缘 频数、列边缘 频数、百分比(2)期望值分布:根据比例求出的各个变量的期望值。一般情况下,任何一个单元中频数的期望值:=其中:为给定单元格所在行的合计,为给定单元格所在列的合计,为观察值总个数,即样本容量。3.说明计算 统计量的步骤 若用 表示观察值频数,用 表示期望值频数,2统计量可为:2=()2 步骤一:计算 步骤二:计算()2 步骤三:计算()2 步骤四:计算 2=()2 4.简述 系数、系数、系数各自的特点 相关系数:是描述 22 列联表 数据相关程度最常用的一种相关系数,计算公式为:=2 此时系数的取值是在 0 1 之间,且 的 绝对值越大,说明变量的 相关程

27、度越大。但当列联表的行数 R 或列数 C 大于 2 时,系数将随着 R 或 C 的变动而增大,且 值 没有上限。列联相关系数:简称 c系数,主要用于 大于 22 列联表的情况,计算公式为:c=22+相互独立 时,系数为 0,不可能 大于 1,其可能的最大值依赖于列联表的行数和列数,且随着 R 和 C 的 增大而增大。根据 不同的行和列 计算的列联系数 不便于比较,除非 两个两个列联表中的行数和列数 一致。V相关系数:克莱默 提出了 V系数,计算公式为:V=2min(1),(1)取值在 01 之间 13.解释 的含义和作用(第十章)含义:组间平方和(SSA)占总平方和(SST)的比例 记 为 R

28、2,即 2=作 用:其平方根 R就 可以用来 测 量 两个变量之间 的 关系强度 第十章 方差分析 1.什么是方差分析?它研究的是什么 方差分析就是通过检验 各总体的均值是否相等 来判断分类型自变量对数值型因变量是否有 显著影响。它所研究的是 分类变量(自变量)对 数值型变量(因变量)的 影响。2.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法 作两两比较十分 繁琐,进行检验的 次数较多,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会 增加。而方差分析方法则是 同时 考虑所有的样本,因此 排除了错误累积的概率,从而 避免拒绝一个真实的原假设。3.方差分析包括哪些

29、类型?它们有何区别 类型:单因素 方差分析和 双因素 方差分析。区别:单因素方差分析研究的是 一个 分类型自变量对一个数值型因变量的影响,而双因素涉及 两个 分类型自变量。4.方差分析中有哪些基本假定 每个总体都应服从 正态分布;各个总体的方差 必须 相同;观测值是 独立 的 5.简述方差分析的基本思想 它是通过对数据 误差来源 的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。6.解释因子与处理的含义 在方差分析中,所要 检验的对象 称为 因素或因子,因素的 不同表现 称为 水平 或 处理。7.解释组内误差和组间误差的含义 组内误差()是指每个水平或组的 各样本数据

30、与其 组平均值 误差的平方和,反映了每个样本 内 各观测值的 离散状况。组内误差 只含有随机误差;组间误差()是指 各组平均值 与 总平均值 的误差平方和,反映各样本均值 之间 的 差异程度。8.解释组内方差和组间方差的含义 组内方差(MSE)指因素的 同一水平(同一个总体)下样本数据的 方差,组间方差(MSA)指因素的 不同水平(不同总体)下各样本之间的 方差。9.简述方差分析的基本步骤(1)提出假设 0:1=2=(自变量对因变量 没有 显著影响)0:(=1,2,)不全相等(自变量对因变量 有 显著影响)(2)构造检验统计量 计算各样本的 均值,计算全部观测值的 总均值,计算各 误差平方和,

31、计算 统计量。(3)统计决策 将统计量的值 F与给定的显著性水平 的 临界值 F进行 比较,作出对原假设 0的决策。10.方差分析中多重比较的作用是什么 通过对总体均值之间的配对比较来 进一步检验 到底 哪些均值之间存在差异。11.什么是交互作用 交互作用是指 几个因素搭配在一起 会对因变量产生一种 新的效应 的作用。12.解释无交互作用和有交互作用的双因素方差分析 在双因素方差分析中,如果两个因素对试验结果的影响是 相互独立 的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为 无交互作用 的双因素方差分析或无重复双因素方差分析;如果除了行因素和列因素对试验数据的单独影响外,

32、两个因素的搭配还会对结果产生一种 新的影响,这时的双因素方差分析称为 有交互作用 的双因素方差分析或可重复双因素方差分析。第十一章 一元线性回归 1.解释相关关系的含义,说明相关关系的特点 含义:变量之间存在的 不确定的数量关系 为相关关系 特点:一个变量的取值 不能 由另一个变量 唯一确定,当变量 x 取某个值时,变量 y 的取值可能有几个;变量之间的相关关系 不能用函数关系进行描述,但 也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的 客观规律。2.相关分析主要解决那些问题 变量间 是否存在关系;如果存在,是 什么样 的关系;变量之间的 关系强度 如何;样本所反

33、映的变量之间的关系 能否代表 总体变量之间的关系 3.相关分析中有哪些基本假定 两个变量之间是 线性关系;两个变量都是 随机变量 4.简述相关系数的性质 公式:r=2()2 2()2 性质:;对称性,即=;r的大小与 和 的 原点 及 尺度无关;r仅仅是 与 之间线性关系的一个度量,不能 用于 描述非线性 关系;r虽然是两个变量之间线性关系的一个度量,不意味 着 和 一定有 因果关系。5.为什么要对相关系数进行显著性检验 在对实际现象进行分析时,往往是利用 样本数据 计算相关系数作为 总体相关系数 的 估计值,但由于样本相关系数具有一定的 随机性,它能否说明总体的相关程度往往同 样本容量 有一

34、定关系。因此,为判断样本相关系数对总体相关程度的 代表性,需要对相关系数进行 显著性检验。若在统计上是显著的,说明它可以作为总体相关程度的代表值,否则不能作为总体相关程度的代表值。6.简述相关系数显著性检验的步骤 提出假设:0:=0;1:0 计算检验的统计量:t=|212t(n 2)进行决策:确定显著性水平,若|2,拒绝原假设。7.解释回归模型、回归方程、估计的回归方程的含义 回归模 型:描述 因变量 y如何 依赖自 变量 x和 误差项 的 方 程 称 为回归模 型。表 示:y=0+1+回归 方 程:描述 因变量 的期望值 如何 依赖自 变量 x的 方 程 称 为回归 方 程。表 示:E(y)

35、=0+1 估 计的回归 方 程:根 据 样本数据 求 出的回归 方 程。表 示:=0+1 8.一元线性回归模型中有哪些基本假定 因变量 y与 自 变量 x具有 线性关系;在 重复抽 样 中,自 变量 x的取值是 固 定的,即假定 是 非随机 的;误差项 是一个 期望值为 0 的 随机 变量;对于所有的 x值,的 都 相同;误差项 是一个 服从 正态分布 的 随机 变量,且 独立,即(0,2)。9.简述参数最小二乘估计的基本原理 对于 x和 y的 n对观察值,用 距离各 观 测 点 最近 的一 条直 线 来 代表 x与 y之间的关系与实际数据的 误差比其 它 任 何 直 线都小。根 据 这 一

36、思想求得直 线 中未知 常数的 方法称 为 最 小 二乘法,即使因变量的观察值与估计值之间的 离差平方和 达到 最小 来估计 0和 1的方法。10.解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系 总平方和:对一个具体的观测值来说,变差 的大小可以用 实际观测值 y与其 均值 之差(y)来表示,而 n次观察值的 总变差 可由这些 离差的平方和 来表示,称为 总平方和()。回归平方和:由于自变量 x的变化引起的 y的变化,而其平方和反映了 y的总变差中由于 与 之间的线性关系 引起的 y的变化部分,它是可以由回归直线来解释的变差部分,称为 回归平方和()。残差平方和:除了 x对

37、y眼的线性影响之外的 其他因素 对 y变差的作用,是不能由回归直线来解释的变差部分,称为 残差平方和()。关系:SST=SSR+SSE.11.简述判定系数的含义和作用 含义:判定系数是对估计的归回方程 拟合优度 的度量。2=()2()2 作用:判定系数 2测度了回归直线对观测数据的 拟合优度,取值范围 0,1。越接近1,表明回归平方和占总平方和的比例越大,拟合程度越好;反之,越 接近于0,回归直线的 拟合程度 就 越差。12.在回归分析中,检验和 检验各有什么作用 F检验:线性关系检验 t检验:回归系数检验 13.简述线性关系检验和回归系数检验的具体步骤 线性关系检验 提出假设:0:1=0;1

38、:10 计算检验统计量:=做出决策:确定显著性水平,若,拒绝原假设。回归系数检验 提出假设:0:1=0;1:10 计算检验统计量:=做出决策:确定显著性水平,若,拒绝原假设。14.怎样评价回归分析的结果 所估计的 回归系数 的 符号 是否与理论或事先预期一致;如果理论 上认 为 y与 x之间的 关系 不 仅 是 正 的,而 且在 统计 上 显著(关系显著、系数显著),那么 所 建立 的回归方程 也应该 如 此;回归 模型在多 大程度 上 解释 了因变量 y取值的 差异,可以用 判定系数 来回 答;考 察关于 误 差 项 的 正态性假定 是否 成立。15.什么是置信区间估计和预测区间估计?二者有

39、何区别 置信区 间估计:是对 x的一个 给 定值 0,求 出 的平均值 的 区 间估计。预测 区 间估计:是对 x的一个 给 定值 0,求 出 的一个个别值 的 区 间估计。0 21+(0)2()2=1(置信区间)0 2 1+1+(0)2()2=1(预测区间)区别:预测 区 间 要 比 置信区 间 宽 一些。16.简要说明残差分析在回归分析中的作用 判 断 对 误 差 项 的 假定 是否 成立。第十二章 多元线性回归 1.解释多元回归模型、多元回归方程、估计的多元回归方程的含义 多元回归模型:设因变量为 y,k个自变量分别为 1,2,,描述因变量 y如何依赖于自变量,和 误差项 的方程成为多元

40、回归模型。表示:y=0+11+22+多元回归方程:描述因变量 的期望值 与自变量 1,2,之间关系的方程。表示:y=0+11+22+估计的多元回归方程:用 样本统计量 0,1,2,去 估计 回归方程中的 未知参数0,1,2,时就得到了估计的多元回归方程。表示:=0+11+22+2.多元线性回归模型中有哪些基本假定 误差项 是一个 期望值为 0 的随机变量;对于自变量,的所有值,的方差 都相同;误差项 是一个服从 正态分布 的随机变量,且 相互独立,即(0,2)。3.解释多重判定系数和调整的多重判定系数的含义和作用 多重判定系数:多元回归中的 回归平方和 占 总平方和 的比例。2=1 作用:是度

41、量多元回归方程 拟合程度 的一个统计量,反映了在因变量 y的变差中被估计的回归方程所 解释的比例。调整的多重判定系数:2=1(12)(11)作用:用样本容量 n和自变量的个数 k去调整 2得到,这使得 2的值永远小于 2且 2的值不会由于模型中自变量个数的增加而越来越接近 1,避免 增加自变量 而 高估 多重判定系数。4.解释多重共线性的含义 回归模型中 两个或两个以上 的 自变量彼此相关 时,称回归模型中存在多重共线性。5.多重共线性对回归分析有哪些影响 变量之间高度相关 时,可能会使回归的 结果混乱,甚至会把分析 引入歧途;可能对参数 估计值 的 正负号 产生影响;特别是 的正负号有可能同

42、预期的正负号 相反;6.多重共线性的判别方法主要有哪些?模型中各对自变量之间 显著相关;当模型的线性关系检验(F 检验)显著 时,几乎 所有回归系数 的 检验 却 不显著;回归系数的正负号与预期的 相反;容忍度(12)与 方差扩大因子(VIF=112)。容忍度越小,多重共线性 越严重,当 小于 0.1 时,存在 严 重多重共线性。越大,多重共线性 越严重,一 般认 为 VIF大于 10时,存在 严 重多重共线性。7.多重共线性的处理方法有哪些 将 一个 或 多个相关的自变量从模型中 剔除,使 保留的自变量 尽 可能 不相关;如 果保留 所有自变量,那 就 应该:避免 根据 t统计量对 单个参数

43、 进行 检验;对因变量 y值的 推断(估计 或 预 测)限 定在 自变量样本值 的 范围内。8.在多元线性回归中,选择自变量的方法有哪些 向前 选择;向后 剔除;逐步 回归;最优 子集。第十三章 时间序列分析和预测 1.简述时间序列的构成要素 趋势(Trend);季节性(Seasonality);周期性(Cyclicity);随机性(Irregular variations)2.利用增长率分析时间序列时应注意哪些问题 当时间序列中的观察值出现 0 或负数 时,不宜 计算增长率;不能单纯 就增长率论增长率,要注意增长率与 绝对水平 的综合分析;大的增长率 背后,其隐含的绝对值 可能很小,小的增长

44、率 背后其隐含的绝对值 可能很大。3.简述平稳序列和非平稳序列的含义 平稳序列:基本上 不存在趋势 的序列,各观察值基本上在某个 固定 的 水平 上 波动 或虽有波动,但并不存在某种规律,而其波动可以看成是 随机 的 非平稳序列:是包含 趋势、季节性或周期性 的序列,它可能只含有其中的 一种 成分,也可能是几种成分的 组合。因此,非平稳序列又可以分为 有趋势 的序列、有趋势和季节性 的序列、几种成分 混合 而成的 复合型序列。4.简述时间序列的预测程序 确定时间序列所包含的成分,也就是 确定 时间序列的 类型;找出 适合 此类时间序列的 预测方法;对可能的预测方法进行 评估,以确定 最佳 预测

45、方案;利用最佳预测方案进行 预测。5.简述指数平滑法的含义 指数平滑法是指对过去的观察值加权平均进行预测的一种方法。该方法使得第 t+1 期的 预测值等于 t 期的 实际观察值 与第 t 期 预测值 的 加权平均值。指数平滑法是 加权平均 的一种特殊形式,观察值时间 越远,其 权数 也跟着呈 指数 的 下降,因而称为 指数平滑。指数平滑法有一次指数平滑法、二次指数平滑法、三次指数平滑法。一次指数平滑法也可用于对时间序列进行 修匀,以 消除随机波动,找出序列的变化趋势。6.简述复合型序列预测的步骤 确定 并 分离季节成分:计算 季节指数,之后将各实际观察值分别初一相应的季节指数,将季节指数从时间

46、序列中分离出去;建立预测模型并进行预测:对消除了季节成分的时间序列建立适当 预测模型,计算出各期 的 预测值,用预测值 乘以 相应的 季节指数,得到最终的预测值。7.简述季节指数的计算步骤 计算移动平均值(季度数据 采用 4 项移动平均,月份数据 采用 12 项移动平均),并将其结果进行“中心化”处理,也就是将移动平均的结果再进行一次 二项 的 移动平均,即得出“中心化移动平均值”(CMA);计算移动平均的比值,也称为 季节比率,即将序列的各观察值 除以 相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值;季节指数 调整。各季节指数的平均数应等于 1 或 100%,若根据第二步计

47、算的季节比率的平均值不等于 1 时,则需要进行调整。具体方法是:将第二步计算的每个季节比率的平均值除以它们的总平均值。第十四章 指数 1.指数的含义和性质 含义:广义上,是指任何两个数值对比形成的相对数;狭义上,是指用于测定多个项目在不同场合下综合变动的一种特殊相对数。实际应用中使用的主要是狭义的指数。性质:相对性;综合性;平均性;代表性;动态性 2.什么是同度量因素?同度量因素在编制加权综合指数中有什么作用 含义:是指若干 度量单位不同,不能直接相加 的指标,过渡到可以加总和比较而使用的媒介因素。作用:同度量因素在计算总指数的过程中,对各因素起着 权衡轻重 的作用,所以也叫 权数。3.拉氏指

48、数与帕氏指数各有什么特点 拉氏指数:在计算综合指数时将作为权数的 同度量因素 固定在 基期。(数量 指数)帕氏指数:在计算综合指数时将作为权数的 同度量因素 固定在 报告期。(质量 指数)4.加权平均指数与加权综合指数有何区别与联系 加权平均指数:以 个体指数 为基础,通过对个体指数进行 加权 平均来编制的指数。加权综合指数:通过加权来测定一组项目的 综合变动,有加权数量指数和加权质量指数。区别:思路上,加权综合指数是 先综合,后对比,而加权平均指数是 先对比,后综合;运用资料上,加权综合指数需要研究总体的 全面资料,加权平均指数对资料要求 比较灵活;经济分析 中的具体作用上,加权指数方法主要

49、用于价格指数的计算。联系:加权平均指数和加权综合指数的联系主要表现为在一定的权数条件下,两类指数间有 变形 关系。5.什么是指数体系?它有什么作用 含义:是指由 总量指数 及 其 若干个 因素指数 构 成的数量关系 式。作用:指数体系是进行 因素分析 的 根据;利 用各指数 之 间的联系进行指数间的 相互推算;用综合指数法编制总指数时,指数体系也是 确定同度量因素时期 的 根据之 一。6.试述平均数指数体系 总平均 水 平指数:=10=11 1 00 0 组 水 平变动指数:=1=11 1 01 1 结构 变动指数:=0=01 1 00 0 总平均 水 平指数=组 水 平变动指数 结构 变动指数(=)11 1 00 0=11 1 01 1 01 1 00 0 总 水 平变动 额=各组 水 平变动 影响额+结构 变动 影响额(10=(1)+(0)(11 1 00 0)=(11 1 01 1)+(01 1 00 0)7.构建综合评价指数时需要考虑哪些方面的问题 建立 综合 评 价指标 体系;确 定各项指标的 评价标准;确 定各项 评 价指标的 权重;选择评 价指标的 合成方式。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 初中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁