《第二讲微观数据结构及ols.pptx》由会员分享,可在线阅读,更多相关《第二讲微观数据结构及ols.pptx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第2讲微观经济数据结构课程内容微观经济数据结构复习OLS估计量OLS渐进性质开始前的准备向量与矩阵识别的概念什么是识别?给定充分观测值时参数的确定观测等价性(observationalequivalence)可识别性(identifiability)一个模型所定义的联合概率分布函数Prx|的两个结构在观测上是等价的,如果Prx|1=Prx|2.如果给定数据,两个结构模型意味着相同的联合概率分布,则两个结构在观测上是等价的。意味着识别失效。识别性:一个结构0是可识别的,如果在参数空间上不存在观测等价的其他结构。观测数据观测数据与实验数据?x的随机性?微观经济观测的主要来源,是住户、厂商的调查以及
2、政府管理数据,或是人口普查数据。正式定义,观测数据是指在没有企图控制抽样数据特征的条件下,通过对相关总体抽样收集到的调查数据。观测数据抽样的方式有哪些?简单随机样本多阶段调查1、层(strata):把总体彻底分割为互补相交的一些子总体。2、初级抽样单元(primarysamplingunits)PSUs:对层分割成互不相交的子集。3、第二级抽样单元()SSUs:对PSU分割成一些单元。4、最终抽样单元()USU:选择最终单元进行采访,可以是住户,也可以是住户的集体。两阶段抽样存在问题:总体的非代表、抽样权重、集聚观测数据有偏样本数据的概率分布与总体的概率分布不相同。外生抽样:基于外生变量x,将
3、可利用的样本分割成一些子样本。对外生抽样的偏离基于响应抽样公共交通工具选择旅游纪念品购买支出个体被样本抽取的概率依赖于个体所做的选择或响应长度偏倚抽样Q:调查失业的平均持续时间,如何实施调查?特殊时期失业人员调查曾经失业过的人员调查调查数据质量调查无响应问题:个体参与的动机取决于住户的特征或者要回答的问题类型而变化。存在无响应问题,得到的估计是否是有偏的?调查数据质量缺失数据:调查者不一定回答每个问题,即使回答也可能造假。存在缺失的问题:样本量减少选择性偏倚测量误差:粗心大意、故意错报、回忆不完善、问题理解错误样本损耗:全部参与无参与不完全参与微观数据来源美国微观数据库收入动态面板研究PSID
4、:1968年开始执行全国性调查,调查中心建立在密歇根大学,涵盖40000多人,收集经济和人口数据。当前人口调查CPS:对50000个住户的每月国家调查,提供劳动力特征信息。全国纵向调查NLS:20世纪60年代中期,四个分组,问题涉及工作经历、教育、培训、家庭收入、家庭组成、婚姻状况、健康状况以及年龄、性别等。微观数据来源中国微观数据库中国家庭追踪调查CFPS:北京大学社会科学调查中心,2010年正式开始访问,有不同的主体调查问卷。中国家庭金融调查CHFS:西南财经大学中国家庭金融调查与研究中心,每两年调查一次。中国家庭收入调查:北京师范大学中国收入分配研究院,目前共五次调查。处理微观数据数据准
5、备无响应数据,逐表删除测量误差检查数据展示描述统计量微观数据举例2007年工业企业数据库数据describeinvestmentassetfixedassetlaborcfsummarizeinvestmentassetfixedassetlaborcfsummarizeinvestment,detailtableregistrationtabstatinvestmentcfasset,stat(countmeanp50sdskewkurt)col(stat)思考Q:估计量?Q:好的估计量有哪些性质?Q:哪些是你需要的性质?线性模型简单线性回归模型SST=SSR+SSER2重不重要?简单线性回归模型的假设无偏性Q:怎么像非专业人解释无偏性?估计的标准误差高斯马尔科夫定理“BLUE”线性模型横截面数据的单方程线性回归模型矩阵形式y称为被解释变量、因变量、内生变量x称为回归元、协变量、预测量OLS估计量的分布讨论大样本性质:渐进性一致性极限分布