《应用计量经济学第11章.pptx》由会员分享,可在线阅读,更多相关《应用计量经济学第11章.pptx(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第11章回归课题研究Slides by Niels-Hugo BlunchWashington and Lee University选择研究主题 选择研究主题至少要注意三个关键:1. 选择一个你感兴趣的领域,同时/或者你对该领域有些许了解2. 确保数据是可获得的,并要保证一定的样本容量,推荐不少于25个观测值3. 确保你的研究主题是有实质含义的: 避免选择纯描述性的,或本质上是同义反复的研究主题 否则,应选择这样的研究主题:向来是经济学或行为选择的人们感兴趣的问题1从哪里选择? 你原来使用的经济学教科书、笔记 经济学期刊、杂志 例如,Table 11.1 给出了一份杂志的清单选择研究主题2Ta
2、ble 11.1a 潜在研究主题的来源3Table 11.1b 潜在研究主题的来源4收集数据在进行任何数量分析之前,数据应当: 收集好 整理好 存入电脑通常,这将是一个耗时的、令人沮丧的工作,因为: 寻找数据的困难 理论变量与实践变量之间定义上的不同 数据输入电脑、数据传输过程中可能存在误差但是,花费时间精力仔细收集数据是值得的,因为了解数据来源和定义的研究者在使用数据构建回归模型时更有可能少犯错误下面将讨论数据收集的更多细节5收集哪些数据选择数据意味着选择哪些具体的解释变量:被解释变量所有相关的解释变量至少有5个方面需要考虑:1. 时间间隔:如果被解释变量是年度数据,解释变量也应当是年度的2
3、. 数据质量:如果一个给定的变量的市场和/或质量随着时间发生了改变,则没有理由再使用这些数据例子:TV随着时间发生了巨大的改变以至于必须考虑使用货币等价物的质量:更高的可比性63. 名义还是真实值? 依靠理论决定 是否需要去掉通货膨胀的影响? TV,再次作为例子,更有可能使用真实值4. 根据是截面数据或时间序列数据选择合适的变量定义 TV,又一次作为例子:全国广告费支出在一个时间序列模型中是一个不错的选择,而不同州的广告支出则是截面模型的选择5. 当读(甚至是创造)数据描述时需要当心: 数据来源是哪里? 收入是以真实还是名义值衡量的? 是单独的还是总和的物价水平?收集哪些数据7从哪些寻找经济数
4、据 尽管有部分研究者通过调查或其它技术(见第11章第3节)产生数据,大量的经验研究使用的是公开的数据 主要的数据来源包括:1. 政府出版物Statistical Abstract of the U.S.the annual Economic Report of the Presidentthe Handbook of Labor StatisticsHistorical Statistics of the U.S. (published in 1975)Census Catalog and Guide中国统计年鉴其它年鉴、资料:中国金融年鉴、新中国50年统计资料汇编、中国农村统计年鉴8从哪些寻
5、找经济数据9缺少数据 如果没有数据怎么办? 如果你通过查询所有可能的数据资料都没有找到相关数据,那么你应当怎么办? 对这个问题的回答取决于“有多少数据是缺失的”?1.少量观测值: 截面数据 将这些观测值剔除样本 时间序列数据: 可以插入数据:使用相邻数据的均值102. 根本没有观测值对于部分理论可能是这样的: 从第6章已经知道,很可能导致遗漏解释变量的偏误 一个可能的方案是使用代理变量(proxy variable) 例如,净投资在一些国家的数据中可能是没有资料的 在这种情况下,可以使用总投资作为代理变量,背后的假定是净投资是总投资的一个比例部分缺少数据11高级数据来源 到目前为止,所有的数据
6、都是:1.截面数据或时间序列时间2.所有的数据是被“收集的”,不是被“创造的” 不过:1.时间序列数据与截面数据可以“混合”起来形成面板数据2.数据可以通过调查来“创造” 下面简要介绍这两种高级的数据来源,并说明为什么不使用这两种高级数据来源作为研究的首先12调查 我们社会的每一个角落,根据不同的目的,都可以进行调查,例如: 市场调查:通过调查获取产品信息、竞争情况 竞选民意调查:通过调查调查竞选的广告支出、策略 政府机构通常会进行不同目的的调查:人品普查、经济调查等13调查 当你决定使用调查作为你的数据来源时,一定要注意调查是比较困难的: 需要仔细的思考调查的可行性 与被调查者保持联系,可能
7、还需要追加问题 问答的表达必须是清晰的,同时不能带有倾向性 样本选择必须是随机的,不能是有选择性的 不推荐经验研究的初学都使用调查的方法收集数据14面板数据 面板数据是由时间序列数据与截面数据“混合”而成,生成一个单独的数据集 使用面板数据的两个主要原因: 提高样本容量 提供时间序列数据、截面数据可能无法发现的一些线索15面板数据 例子:假设我们对预算赤字与利率水平的关系感兴趣,但是只有10年的数据可以获得 但是10个样本容量对于一个回归模型而言容量过小 但是,如果可以获得6个不同国家相同10年的预算赤字、利率水平的数据,我们将获得60个观测值,大大提高了样本容量 于是,我们得到了一个由截面数
8、据、时间序列数据的集合面板数据 第16章中将会讨论面板数据的估计方法16研究的建议我们现在给出一些实际进行经验研究时的建议建议被分成三个部分:1. 应用计量经济学的10条戒律 (by Peter Kennedy)2. 如果得到了非期望的回归符号,应当检查哪些方面?3. 需要重申的一些提示(这些提示将会涉及到其它章节)17应用计量经济学的10条戒律1. 使用基本的思想和经济理论:例如:人均变量应与人均变量对应,使用真实汇率来解释进口,出口等2. 提出正确的问题:提出大量表面上有些愚蠢的问题,以保证你充分理解研究的目的3. 全面把握:应当对研究课程的历史、机构、运行限制、独特之处、文化风俗有足够的
9、了解4. 检察数据a. 包括主要的总结指标、作图、数据清理等b. 目标是充分理解数据185. 应当是易于理解的:a. 使用简单的模型,除非不可能使用简单的模型,才使用复杂的模型b. 任何模型需要考虑模型的设定、函数形式、估计方法等6. 仔细观察你的结论:a. 检查估计数据的符号、大小是否有意义b. 使用“laugh test”7. 明确数据挖掘的成本与收益:a. “糟糕的”数据挖掘:故意寻找一些机制b. “好的”数据挖掘:对数据进行实验,以寻找经验结论以提出经济理论并使用新的数据集来检验应用计量经济学的10条戒律198. 准备好做出妥协:a. 古典假设几乎不大可能被完全满足b. 计量经济学人员
10、不得不做出一些妥协,使用一些次优的方法,而这些方法的特征、后果通常是不知道的c. 计量经济学有时是特别地、临时地发展一些针对潜在问题的分析方法1.9. 不同被具有一定意义的统计显著性迷惑:a.如果样本容量足够大,于是标准误足够小,任何双边假设检验的零假设都可能被拒绝b.实质性显著有多大同样是重要的,不仅仅是统计上的显著性应用计量经济学的10条戒律2010. 报告敏感性分析报告:a. 规模检查:i. 样本容量ii. 函数形式iii. 解释变量的个数iv. 代理变量的选择b. 如果在规模检查中,估计的结果不是稳健的,那么就有必要对研究的结论产生怀疑应用计量经济学的10条戒律21如果得到了非期望的回
11、归符号,应当检查哪些方面?1. 再次检查预期的符号例如,虚拟变量是否被使用混乱?2. 检查数据的输入误差与/或异常值3. 检查遗漏的解释变量最有可能引起显著的非预期的符号4. 检查无关的多余解释变量最有可能引起不显著的非预期的符号5. 检查多重共线性多重共线性提高了估计系数的方差、标准误,使系数有可能有非预期的符号226. 检查样本选择的偏误观测值不是随机选择的,也可能导致非预期的符号7. 检查样本容量样本容量越小,标准误越大8. 检查你的理论如果表面上没有错误,那么有可能就是理论错了,或数据错了如果得到了非期望的回归符号,应当检查哪些方面?23需要重申的一些提示1. 不要尝试最大化 (第2章
12、)2. 在建立模型前,查阅文献,假设系数的符号 (第3章)3. 在估计模型前,检查和清理数据集,异常值不会自动被清除,需要通过检查以决定异常值是否应当包含在样本中 (Chapter 3)4. 注意古典假设 (Chapter 4)5. 通常来说,使用单边t检验,除非系数的预期符号是值得怀疑的 (Chapter 5) R2246. 不要因为t值不显著而放弃一个解释变量。一般来说,允许一个t值不显著的变量包含在模型中,是为了降低遗漏解释变量的风险 (Chapter 6)7. 应当知道如何分析遗漏解释变量产生的估计偏误的方向、大小 (Chapter 6)8. 理解所有不同的函数形式以及主要的应用方面,
13、记住,根据理论,而不是拟合优度选择具体的函数形式 (Chapter 7)需要重申的一些提示259. 多重共线性不会造成偏误,会造成估计方差偏大,估计的系数本身是无偏的,因此,最好的修正多重共线性的方法,也许是什么也不做 (Chapter 8)10. 如果你得到了显著的DW、Park或White检验,记住,首先考虑设定误差存在的可能性。除非你使用了最优的模型设定,否则不要轻易使用GLS方法替代OLS方法,也不要轻易使用调整的标准误 (Chapters 9 and 10)需要重申的一些提示2611. 调整的标准误,例如, NeweyWest标准误,或HC标准误将继续使用OLS系数估计值。仅仅是标准
14、误的估计改变了,系数本身的估计没有被改变 (Chapters 9 and 10)12. 最后,如果有怀疑,请依据基本的思想、经济理论,而不是统计检验需要重申的一些提示27计量经济学家的道德 我们认为当计量经济学家估计经济模型时,有两个主要的目标:1. 当尝试避免主要的计量经济问题时,应当尽可能少的使用不同的模型设定 惟一的例外是第6章第4节中的敏感性分析2. 需要报告不同设定的数量、种类,于是,研究报告的阅读者能评估你的结论的份量28撰写研究报告 绝大多数好的研究报告都有一些共同的特点: 一个简介,定义了被解释变量,并指出研究的目的 一个简短的对之前的文献、研究的回顾 关于模型(方程)设定的解
15、释 解释变量 函数形式 回归系数的预期的符号 数据描述 生成变量 数据来源 数据谬误(如果有的话)29撰写研究报告使用标准的报告模式,报告每一个估计模型的结果 如果你估计超过一个设定的模型,记住解释哪一个是最好的,以及为什么是最好的对回归结果的仔细分析: 讨论任何可能遭遇的计量经济问题 完成所有的报告: 估计的议程 假设检验一个简短的总结/结论,并指出政策建议和对未来研究的建议参考文献附录中应包含所有的数据,所有的回归方程,所有电脑的输出结果30Table 11.2a 回归检查清单31Table 11.2b 回归检查清单32Table 11.2c 回归检查清单33Table 11.2d 回归检查清单34Table 11.3a 回归指南35Table 11.3b 回归指南36Table 11.3c 回归指南37