《(2)--stata常用命令大全计量经济学.docx》由会员分享,可在线阅读,更多相关《(2)--stata常用命令大全计量经济学.docx(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、stata save命令FileSave As例L 表1.为某一降压药临床试验数据,试从键盘输入Stata,并保存为Stata格式文件。STATA数据库的维护排序SORT变量名1变量名2变量更名STATA数据库的维护 删除变量或记录 drop xl x2 drop xl-x5 drop if x0 drop in 10/12 drop if x=. drop if x=. y=. drop i f x二二.&y二二. drop _allrename原变量名新变量名/*删除变量xl和x2/*删除数据库中介于xl和x5间的所有变量(包括xl和x5)/*删去xl0值log(x),当x
2、0作用:将字符型变量转化为数值变量。/*保留第1020个记录,其余记录删除/*保留数据库中介于xl和x5间的所有变量(包括xl和x5),其余变量删除/*保留x0的所有记录,其余记录删除STATA数据库的维护替换已存在的变量值replace变量=表达式replacebolck=6 if block=0replacez=. if z0/* 将block = 0的数全部替换为6O/*将所有小于0的z值用缺失值代替。replace age = 25 in 17/*将第17条记录中的变量age替换为25ofor var x* : replace X=0 if X=二./*将所有第一个字母为x的变量替换为
3、0,如果该变量的值为缺失值纵向连接数据库Ex3-3. dta:xO1.355024502.200024003.300018004.395032005.38003250xluse E:教学、上机ex3-2, dta,clear1.2450145022.2100240023.2300380024.159042002xOxlE:教学、上机ex3-3. dtaappend usingxOxl1.245014502.210024003.230038004.159042005.355024506.200024007.300018008.395032009.380032502222横向联接数据库xOEx3-
4、5. dta:1.13579.222.34547.483.45234.664.66628.09bhyoyi命令.drop all .use E: 教学MPH 上机ex3-5. dta.sort bh, save E: 教学MPH 上机ex3-5. dta,replace file E: 教学MPH 上机ex3-5. dta saved.use E: 教学MPH 上机ex3-4. dta, sort bh.merge bh using E:教学MPH 上机ex3-5. dta结果bhxOxlyoylmerge1.112243579.22.321526*13.316494547.44.341857
5、5234.65.352068*16.6966282列数据接龙Stack 变量名,into (新变量名)| group(#) clear wide示例统计描述及区间估计定量资料的一般描述均数、标准差、百分位数、中位数summarize变量名,detail 统计描述及区间估计百分位数centile变量名 ,centile(# # .)cci normal meansd level (#)统计描述及区间估计定性资料的一般描述按照分类变量给出频数和构成比tabulate变量名例2. 有三组(group)患者,男女(sex)若干人,sex=l表示男性,sex=0表示女性。测得其血红蛋白浓度(xl,%)和
6、红细胞计数(x2,万/mm3),资料存入c:mydataex2. dta。试对其进行描述。见 ex5-2use c:mydataex2.tab group.tab sex.tab group, sum(xl).tab group, sum(x2)统计描述及区间估计可信区间的估计ci 变量 ,level (#) binomial poisson exposure (观察数变量)by (分组变量)total cii 观察数均数标准差,level (#)level (#)/*指定可信度,缺失时为95 (%)by(分组变量)/*指定按分组变量分别估计均数的可信区间total/*指定除按分组变量估计可信
7、区间外,还对整个数据估计,仅用于指定了 by (分组变量)时use c:mydataex2.sort group/*在用by (分组变量)前,必须对分组变量排序.ci xl x2, by (group)STATA的作图作图命令GRAPHgraph变量名,图形类型通用选择项特殊选择项图形类型histogram /*直方图,为缺省值。oneway /* 一维散点图twoway /*二维散点图、线图matrix /*二维散点图阵bar /*条图、百分条图pie /*圆(饼)图box /*箱式图star /*星形图STATA的作图作图命令GRAPH常用选项bin(#)/*将数据分几组,缺省为5ofre
8、q/*指定纵轴用频数表示,否则为频率。normal /*给直方图加上相应正态曲线。xlab/ylab/(#, #) /*指定坐标轴的界点。b2/12(“字符串” )/*指定坐标轴的副标题。STATA的作图如何利用STATA绘制频数分布图?例 130名14岁女孩身高资料。gra x, bin(10) freq normal xlab(124, 128, 132, 136, 140, 144, 148, 152, 156, 160, 164) ylab(5, 10, 15, 20, 25, 30, 35, 40)数值变量资料的描述 均数、几何均数、中位数、百分位数 极差、四分位数间距、方差、标准差
9、 变异系数 对称分布均数土标准差偏态分布中位数土四分位数间距数值变量资料的描述 means 变量名 summarize变量名,detail centile 变量名 ,centile(tt)其他选项 detail/* 详细描述,缺失时为简单描述centile(#) /*指定需要计算的百分位数某市1997年12岁男童120人的身高(cm)资料如下 sum x sum x, d sum x if x140 sum x if x140,d centile x centile x, centile(25, 50, 75) 例 有五份血清的抗体效价为 1:10, 1:20, 1:40, 1:80, 1:1
10、60, 描述其抗体滴度的平均水平。 means xSTATA的作图 作图命令graph简写gragra 变量名,图形类型通用选择项特殊选择项 图形类型 histogram /* 直方图 oneway /* 一维散点图 twoway /*二维散点图、线图 matrix /*二维散点图阵 bar /*条图、百分条图 pie/*圆(饼)图box/*箱式图star /*星形图 直方图 数值变量资料的统计分析 样本均数与总体均数比较的t检验配对设计t检验成组设计t检验方差齐性检验样本均数与总体均数比较的t检验ttest变量名= #valttesti #obs ttmean #sd #val例问题:统计量
11、与参数不同的两种可能其一:抽样误差(偶然的、随机的、较小的)其二:本质上的差别(必然的、大于随机误差)例样本:某医生随机抽查10名某病患者的血红蛋白,求得其均数为12. 59 (g/dl),标准差为L 632619 (g/dl) o问题:该病患者的平均Hb含量是否与正常人的平均Hb含量相同(正常人的平均Hb含量为14.02 (g/dl)oSTATA命令ttest变量名= #valttestx =14.02STATA结果ttest x=14.02One-sample t testVariableObs MeanStd. Err.Std. Dev.95% Conf. Intervalx1012.5
12、9. 51627941.63261911.4220913. 75791Degrees of freedom: 9Ho: mean(x) = 14. 02Ha: mean 14. 02t =-2.7698t =-2. 7698t =-2.7698P |t| =0. 0218P t二0.9891STATA命令ttesti#obsttmean#sdttvalttesti1012. 591.63261914.02配对设计t检验 ttest变量1二变量2STATA命令 ttestxl=x2STATA结果 ttest xl=x2Paired t testVariable | Obs Mean Std. E
13、rr. Std. Dev. 95% Conf. Interval +xl |1012.59.51627941.63261911.4220913.75791x2 |1013.27.34158131.08017512.4972914.04271+diff |106799999. 52042721.645735-1. 857288.4972881Iio: mean (xl - x2) = mean (diff) = 0Ha: mean(diff) 0t =-1.3066t =-1.3066t =-1.3066P |t| = 0. 2237P t = 0. 8881成组设计t检验ttest 变量 1
14、二变量 2, unpaired unequalttest 变量,by (分组变量)unequalttesti ttobsl #mean1 #sdl #obs2 #mean2 #sd2 ,unequalunpaired 表示非配对的,如不选就作配对t检验unequal表示假设两组方差不齐,如不选表示假设两组方差达到齐性例(成组设计)分别测得14例老年人煤饼病人及11例正常人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组的均 数有无差别STATA命令ttest xl=x2, unpairedttest x, by(g)STATA结果ttest xl=x2, unpTwo-sample t
15、test with equal variancesVariable | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval+xl144.377857.38751.4498923. 5407145.21x26. 69404+combined |2514. 884.33064531.6532274. 2015821 diff |2. 467547.1668972-1.150325. 636752115. 528182.52324311. 7354014.362324Degrees of freedom: 235. 5664181.8066Ha: diff
16、 sdtesti ttobsl #mean1 #sdl #obs2单因素方差分析及方差齐性检验oneway因变量分组变量,选择项noanova/*不打印方差分析表missingtabulatescheffeBonferronisidakHo: mean(xl) - mean(x2) = diff = 0Ha: diff 二-1.8066P |t|0. 0839#mean2 #sd2/*将缺省值作为单独的一组/*打印各组的基本统计量表/* Scheffe 法/* Bonferroni 法/* Sidak 法简写:bon各组均数两两比较oneway x group, noanova schRow
17、Mean-|Col Mean简写:简写:sch简写:siComparison of var3 by group(Scheffe)425I0.426I3 |-.91- 485I0.0240.330STATA软件及其应用TH秩和检验和相关与回归分析秩变换配对资料的秩和检验;两组资料的秩和检验;多组资料的秩和检验;直线相关分析;等级相关分析;直线回归分析;秩变换genrank新变量=原变量egen新变量=rank (原变量)配对资料的秩和检验signrank 变量1 =变量2 if变量1!二变量2两组资料的秩和检验ranksum观察值变量,by (分组变量)两组资料的秩和检验两组资料的秩和检验例3用复方猪胆胶囊治疗老年性慢性支气管炎患者403例,疗效见第(1)(3)栏。问该药对此两型支气管炎疗效是否相同? 两组资料的秩和检验expand franksumx,by(g)多组资料的秩和检验kwallis观察值变量,by (分组变量) 多组资料的秩和检验直线相关和回归分析correlate变量名pwcorr变量名,regress因变量自变量predict新变量,stdpstdpstdfsigstar(#)sig star (#)stdf计算估计值的标准误 估计预测值y的标准差打印相关系数假设检验之P值如果相关系数的假设检验之P值小于扎则在相关系数旁打印星号