《stata画图和线性回归基础.ppt》由会员分享,可在线阅读,更多相关《stata画图和线性回归基础.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Stata 画图和回归基础画图和回归基础Stata作图作图stata 提供各种曲线类型,包括点提供各种曲线类型,包括点(scatter)、线()、线(line)、面()、面(area),直),直方图(方图(histogram)、)、条形图(条形图(bar)、饼图()、饼图(pie)、函数曲线)、函数曲线(function)以及矩阵图()以及矩阵图(matrix)等。)等。同时,对时间序列数据有以同时,对时间序列数据有以ts 开头的一系列开头的一系列特殊命令,如特殊命令,如tsline。还有一类是对双变量。还有一类是对双变量的回归拟合图(的回归拟合图(lfit、qfit、lowess)等。)等。
2、作图时命令方式比较复杂,建议多用菜单方式。作图时命令方式比较复杂,建议多用菜单方式。一起来做下列图形:一起来做下列图形:简单图形简单图形打开打开wage1.dta1。男性和女性工资均值的条形图男性和女性工资均值的条形图2。白人和其他人的工资的饼状图白人和其他人的工资的饼状图3。wage的直方图,并检验是否服从正态分布。的直方图,并检验是否服从正态分布。4。wage的核密度分布图。的核密度分布图。组合图形组合图形画出画出price与与weight的散点图,并画出其拟的散点图,并画出其拟合线。合线。图形界面设计:图形界面设计:图形标题,图形标题,X轴标志,轴标志,Y轴标志,样式选择,轴标志,样式选
3、择,图例,分组标志。图例,分组标志。两个练习:两个练习:1。完成下列汽车拟合图。完成下列汽车拟合图。2。查阅数据,并按照要求完成图形。查阅数据,并按照要求完成图形。改上面五个标注,用改上面五个标注,用twoway graph里面的里面的legend(override default keys):1 国产车国产车 2 进口车进口车 3 国产车拟合国产车拟合 4 进口车拟合进口车拟合 5 整体拟合整体拟合 2、中国的、中国的GDP(以购买力平价计)何时能超过美(以购买力平价计)何时能超过美国?从国?从Penn World Table(最权威的跨国宏观数(最权威的跨国宏观数据集)下载两国据集)下载两
4、国1978-2010年年“Population”与与“Real GDP per capita”数据,导入数据,导入Stata中,将中,将两国两国log(GDP)的时间趋势画在一张图上,并做简单的时间趋势画在一张图上,并做简单外推预测(假设未来的增长率与外推预测(假设未来的增长率与1978-2010年间相年间相同)。下载地址为:同)。下载地址为:http:/pwt.econ.upenn.edu/php_site/pwt_index.php。下载时选。下载时选csv格式,按网站说明存储数格式,按网站说明存储数据。据。小样本小样本OLS OLS假设条件:假设条件:1.Eu|X=0 2.条件同方差、没
5、有序列自相关条件同方差、没有序列自相关 3.X与与u不相关不相关 4.Y和和X之间存在线性关系。之间存在线性关系。5.解释变量解释变量 X 是非随机变量,被解释变量是非随机变量,被解释变量Y 是随机变量。是随机变量。6.X 是满秩的,是满秩的,rank(X)=k我们得到:我们得到:习惯上我们用习惯上我们用y_hat=X*b (被解释变量的拟合值)(被解释变量的拟合值)e=Y-y_hat=Y-Xb (残差残差)建立回归方程建立回归方程打开系统文件打开系统文件auto,建立如下方程:,建立如下方程:regress命令详解:命令详解:regress depvar indepvars if in we
6、ight,options sysuse auto,clear regress price mpg weight foreign1。要求方程省略常数项。要求方程省略常数项2。稳健性估计(一般用于大样本。稳健性估计(一般用于大样本OLS)3。重新设置置信区间(默认。重新设置置信区间(默认95%)4。标准化系数(回归系数对被解释变量的重。标准化系数(回归系数对被解释变量的重要性)要性)5。回归中使用部分数据(。回归中使用部分数据(if in)回归后预测值的获得回归后预测值的获得Predict1。拟合值的获得:。拟合值的获得:predict yhat,xb 或者或者 predict yhat2。残差的
7、获得。残差的获得predict e,residuals 或者或者 predict e,res3。残差分布图残差分布图rvfplot yline(0)回归结果的存放:回归结果的存放:e()e(N)number of observations e(mss)model sum of squares e(df_m)model degrees of freedom e(rss)residual sum of squares e(df_r)residual degrees of freedom e(r2)R-squared e(r2_a)adjusted R-squared e(F)F statistic
8、 e(rmse)root mean squared error 可以使用命令可以使用命令 eret list 查看。查看。回归结果解读回归结果解读MSS:回归平方和:回归平方和 df1 自由度自由度 MMS=MSS/df1RSS:残差平方和:残差平方和 df2 RMS=RSS/df2TSS:总平方和:总平方和 df3 TMS=TSS/df3F值:系数的联合检验值:系数的联合检验 R2=MSS/TSS调整的调整的R2 Root MSE=sqrt(RMS)Coef:回归系数:回归系数 Std.Err:系数的标准误差:系数的标准误差t统计量统计量 t的临界值的临界值 p值值95%置信区间置信区间模型
9、常用的其他形式:模型常用的其他形式:对数对数 半对数半对数 平方项平方项 n次方次方 指数指数 交乘项交乘项虽然对函数形式和自变量的选取有选择和检虽然对函数形式和自变量的选取有选择和检验的方法,但最好还是从验的方法,但最好还是从“经济意义经济意义”角度角度确定。确定。例如:考察消费受收入影响的方程,即使参例如:考察消费受收入影响的方程,即使参数项不显著,也不能把它删除掉。数项不显著,也不能把它删除掉。例题例题例一:利用例一:利用wage2的数据检验明瑟的数据检验明瑟(mincer)工资方程的简单形式:工资方程的简单形式:Ln(wage)=b0+b1*educ+b2*exper +b3*expe
10、r2+u 例二:利用例二:利用phillips的数据拟合预期增强的菲的数据拟合预期增强的菲利普斯曲线为利普斯曲线为其中,其中,unemt表示第表示第t期的失业率(期的失业率(%),),inft 表示第表示第t期的通货膨胀率(期的通货膨胀率(%),),infte表示预期表示预期通货膨胀率,通货膨胀率,0表示自然失业率(表示自然失业率(%)。)。按照适应性预期理论,按照适应性预期理论,infte=inft-1。令令inft=inft-inft-1,上述模型可以简化为:,上述模型可以简化为:例三:我国某地区例三:我国某地区1955-1984农产品收购农产品收购量量sg、库存量、库存量kc存放在文件存放在文件warehouse.dta中中估计如下方程:估计如下方程:Sgt=a+b0kct+b1kct-1+u存在滞后一期的变量存在滞后一期的变量