《Stata笔记北京科技大学163.pdf》由会员分享,可在线阅读,更多相关《Stata笔记北京科技大学163.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、改颜色 edit-preference-general prefernce-classic 下面命令框-右键-font-改字号 命令 cd d:改到 d 盘(change directory)dir 查询 d 盘有什么 sysuse auto 系统自带汽车数据,数据变量(字段)显示在右上角 br(owse)浏览数据(字符型红色,数值型黑色,蓝色-右键-value labels-hide all labels标签隐藏)h(elp)li(st)告诉你命令怎么用,下面有例子 左边双击执行,单击复制到命令框 order price mpg(单击右边的变量)order make-foreign 改变变量
2、顺序,从 make 到 foreign g(enerate)new=rep78-trunk 输出新变量(rep78,trunk 是字段,可单击选择,.表示缺省,加减乘除+-*/)list if new=14(=为等于,=为赋值,可以点击 more)li(st)if new2=14&new210000 list make if new2000(竖线表示或者,回车上面那个)!=表示不等于 左边命令,右键 save save data 文件名为 data sysuse auto preserve reserve save auto2 保存时不需加后缀,删除时带后缀.dta sort price 从小
3、到大 gsort price 都可以,比较随意 gsort-trunk price(默认加号,为排序)order make new(将 new 排到第二位)aorder(alphabetic 按字母顺序排序)disp(lay)sin(1)作为计算器使用 ln 以 e 为底-3.锐思数据库选择数据-非金融行业负债表-左边-财务报表-非金融行业 合并标识-1 合并报表 调整标识-1 报表类型-q4、信息来源-q4 公司类别-20-定期报告 信息来源:q4 a 股股票代码 截止日期 流动资产合计 应收账款 总资产 流动负债合计 负债合计 所有者权益合计-非金融行业利润表-前同 净利润 营业收入 ex
4、cel 输出(默认)选择列表签+列名-打开 STATA-file-import-xls 菜单引入文件 clear 可清除数据 varible name 不识别中文 选中第一个 import first row as varible names 第二个 import all data as strings 意思是将数据看作字符型(不选)br(ouse)展示数据 流动比率=流动资产/流动负债 资产负债率=总负债/总资产 产权比率=总负债/所有者权益合计 mkdir d:hsy1mydata 建立文件夹 cd d:hsy1mydata 基于文件夹 dir 显示文件夹 save bs 保存数据,名为
5、bs 直接运行是双击,显示在框内为单击 g(enerate)currrate=Totcurass/Tutcurlia 流动比率(等号后面点右上方 variables)显示(8 missing values generated)有八个缺失值 g lev=Totlia/Totass 负债率 leverage g pright=Totlia/TotSHE 产权比率 porperty save bs2 另存数据 drop 为删除变量 clear 从内存删掉,不会从硬盘删掉-利润表-import save is g incorate=Netprf/Incmope 利润率=净利润/营业利润 save is
6、2-clear use bs2 打开 bs2 g year=year(EndDt)。year(EndDt)表示从变量 EndDt 里把年份取出,如 month()g month=month(EndDt)save bs3-clear.use is2.g year=year(EndDt).g month=month(EndDt).save is3-合并 merge 横向 1 对 1 合并,append 纵向合并-merge 1:1 A_Stkcd year using bs3 注意后面的两个变量名字在原来两个表里是相同的,将 bs3 合并到现在(is3)中 错误类型 variables A_Stk
7、cd year do not uniquely identify observations in the master data 而 master data 指主数据库,using data 从数据库(替换变量名 Stked 改成 A_Stked)rep A_Stked Stked(替换原数据 is3)save is3,replace clear 清除合并 use bs3 duplicates report A_Stkcd year 报告重复的变量(两个)显示(surplus 为多余的)copies|observations surplus-+-1|17017 0 21|21 20 22|11
8、0 105 23|46 44-duplicates drop A_Stkcd year,force 同一公司同一年数据删掉,强制删除 save bs4(is,bs 都除重就可以合并了)keep if _merge=3(3 为完全匹配,1,2 不完全匹配)drop if _merge!=3 如果不完全匹配去除.save bsis-300 创业板(最小)002 中小板 000 主板 keep if substr(A_Stkcd,1,3)=300 筛选,substr()为取字符串函数,从第一位开始取取 3 位,加引号为字符型 summerize Totass 看 Totass 的各种指标,标准差,最
9、大最小值 su Totass,detail 可以看到上下四分位 截尾,去掉两端 1%左右的值 缩尾,将 99%以后的数值以 99%的数值替代,去除极端值,1%一下同理 su Totlia,d(etail)su Accrecv-pright 逐个显示变量的信息 corr(elation)Totass Totlia 相关性分析,一下不相关,低度相关,中度相关 pwcorr Totass Totlia 偏相关 pwcorr Totass Totlia Totcurrass,sig star 显着性水平 significance,小于的标星号,星号在它上面-导出,file-export reg 因变量
10、(因变量:被解释变量;自变量:解释变量)set linesize 140 加宽显示窗格 reg price rep78 headroom trunk weight(std.err.=standard error,T 值,confidence interval 置信区间)P 与 T 反向关系,标准误=T 值 adjusted r-square 调整的 r 方(自变量越多 r 方越大)*表示 P10%,5%*表示 P5%,1%*表示 P1%DF 自由度,degree of free ttest rep78=headroom。t 检验 做散点图 scatter length price。命令是 sc
11、atter line 变量名 1 变量名 2 折线图 hist 变量名 1 变量名 2。做直方图 histogram 柱状图 hist 变量名,freq hist 变量名,addl freq 将 家 庭 记 为 househood,个 人 记 为 people,收 入 记 为 income。输 入 命 令:egen income_people=mean(income),by(househood)就可以了!egen newvar=ma(y),nomiss t(7)即建立一个新变量,等于跨距为 7 的 y 的移动平均数,用较短、未对中的平均数取代起点值和终点值。g y=year(EndDt)提取年
12、份.order CompanyCode y 将公司代码排第一列,年份排第二列 help reshape reshape wide Incmope-InventoryTurnoverRatio,i(CompanyCode)j(y)一定在 i 和前面有逗号!.g Accrecv2009mean=(Accrecv2009+Accrecv2008)/2 reshape long.,destring 变量名,replace 使字符型变数值型 g y=real(substr(Accper,1,4)从字符型取年份,并变成数值型,从左向右取四位.drop Accper.order Stkcd y 按变量 1,
13、变量 2 排序.keep if y=2000|y=2001.g infee=ln(Tcost)对 Tcost 取对数产生 infee 变量.drop Tcost g brandname=1 if substr(Dadtunit,1,4)=普华(4441 missing values generated).replace brand=1 if substr(Dadtunit,1,4)=德勤(51 real changes made).drop Dadtunit.g opinion=0 if Audittyp=标准无保留意见.replace opinion=1 if opinion=.将缺失值替代
14、为 1(214 real changes made)-import excel D:StataBS_AD8BD666A41_(1)0417newBS_AD8BD666A41_(1),sheet(BS)firstrow.br.g y=year(_EndDt).drop _EndDt.g inasset=ln(_Totass)对总资产取对数.g invrec=(_Accrecv+_Invtr)/_Totass drop _Accrecv _Invtr _Totass.order _A_Stkcd y.save bs file saved.clear.import excel D:StataBS_A
15、D8BD666A41_(1)0417newIS_8CBBC6F6EBB_(1),sheet(IS)firstrow.duplicates drop _Stkcd y,force 删除重复的 Duplicates in terms of _Stkcd y (42 observations deleted).drop if _n0&roe wide-Number of obs.5077 -2669 Number of variables 3 -3 j variable(2 values)y -(dropped)xij variables:roe -roe2010 roe2011.g right=1 if roe2010&roe2010=|roe2011&roe201110 不好,可能是否存在多重共线性。方差膨胀因子